首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网络游记文本中旅游行程链提取方法
引用本文:阮陵,葛军莲,张翎,王黎淑,王晓宣.网络游记文本中旅游行程链提取方法[J].地球信息科学,2024(2):477-487.
作者姓名:阮陵  葛军莲  张翎  王黎淑  王晓宣
作者单位:1. 安徽师范大学地理与旅游学院;2. 滁州学院实景地理环境安徽省重点实验室;3. 南京师范大学地理科学学院
基金项目:国家自然科学基金项目(42301258、42171403)~~;
摘    要:网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本中的行程节点,再进行串联、合并处理,工作量较大。自动提取游记文本中的旅游行程链,能够提高数据处理和分析效率。本文基于自然语言处理技术,在深入分析游记网络文本的段落结构和表达特点的基础上,归纳了行程节点和节点次序关系的句法表达规则,构建了行程节点触发词表,进而提出了基于句法规则的旅游行程链提取方法,主要包含行程节点的识别、节点次序关系的识别和旅游行程链的生成,能实现网络游记文本的旅游行程重构。本文采集了蚂蜂窝平台17 226篇南京市网络游记文本数据,采用最长公共子序列算法,开展了本文方法的试验验证。通过对比分析,本文方法提取的旅游行程链和人工识别的真实行程链相似度达到86.14%,高于实体关系抽取领域的BERT-BiLSTM-CasRel深度学习模型的83.1%。相比现有关系提取类深度学习方法需要开展大量的数据标注,本文方法计算更加便捷,准确率相对较高,仅需构建区域旅游点名...

关 键 词:网络游记  网络文本  旅游行程链  行程重构  行程提取  节点识别  规则匹配
点击此处可从《地球信息科学》浏览原始摘要信息
点击此处可从《地球信息科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号