首页 | 本学科首页   官方微博 | 高级检索  
     

面向网页文本的地理要素变化发现
引用本文:郭俊枫,赵仁亮,郑娇龙. 面向网页文本的地理要素变化发现[J]. 地理信息世界, 2015, 0(1)
作者姓名:郭俊枫  赵仁亮  郑娇龙
作者单位:1. 中国矿业大学 北京 地球科学与测绘工程学院,北京,100083
2. 国家基础地理信息中心,北京,100830
摘    要:地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。

关 键 词:地理要素  动态更新  变化发现  网页文本  贝叶斯分类

Changing Information Search of Geographic Features Based on Web Page
GUO Junfeng,ZHAO Renliang,ZHENG Jiaolong. Changing Information Search of Geographic Features Based on Web Page[J]. Geomatics World, 2015, 0(1)
Authors:GUO Junfeng  ZHAO Renliang  ZHENG Jiaolong
Abstract:
Keywords:dynamic udpdating  geographic features  changed detecting  internet web page text  bayes classification
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号