摘 要: | 在线旅游服务模式和海量网络文本的出现为旅游产业规划和用户出游推荐提供了新的信息支撑。然而实时更新的网络文本语义模糊、信噪比低,难以利用,由此,提出了一种基于领域本体和迁移学习的旅游知识图谱构建方法。首先,基于行业规范定义了旅游景点特征体系,建立了以旅游景点为核心的旅游知识图谱,支持景点语义特征的全方位刻画;然后,通过迁移学习方法将预训练语言模型改造为定制化知识抽取器,从网络文本中获取知识三元组,并融合游客足迹、兴趣点语义等信息将分散的相关信息整合为系统性的旅游景点知识图谱。知识抽取实验结果表明,相较于常用的LDA(latent Dirichlet allocation)模型,定制化知识抽取器获取的景点语义知识,其精度与完整性分别提升了50.7%和670%。所构建的旅游景点知识图谱可全面表达现实中的旅游场景,支撑不同尺度下游客行为与市场需求的深入解析,为旅游目的地可持续发展规划提供决策支持。
|