首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 0 毫秒
1.
网络文本蕴涵地理信息抽取:研究进展与展望   总被引:1,自引:0,他引:1  
互联网的普及产生了大量蕴含着丰富地理语义的文本,为地理信息的深度挖掘和知识发现带来了巨大机遇。同时,蕴含地理语义文本的异构性和动态性,使得地理实体的属性数量和种类激增、地理语义关系复杂,对地理信息检索、空间分析和推理、智能化位置服务等提出了严峻的挑战。本文阐述了网络文本蕴含地理信息抽取的技术流程,从地理实体识别、地理实体定位、地理实体属性抽取、地理实体关系构建、地理事件抽取5个方面总结了网络文本蕴含地理信息抽取的进展和关键技术瓶颈,分析了可用于网络文本蕴含地理信息抽取的开放资源,并展望了未来的发展方向。  相似文献   

2.
互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。  相似文献   

3.
地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。  相似文献   

4.
地理学是一门研究各种地理要素的时空分布、演化过程,以及相互作用机制的综合性学科。随着现实世界从二元空间向三元世界的演进,对地理信息内涵的理解、表达和挖掘亟待进一步加深与扩展。现有以"位置+几何+属性"的地理信息表达模式难以支撑各种地理要素及其规律的表达。本文从地理学视角出发,立足三元世界理念,梳理了信息要素及其转变成地理信息的过程,形成了以时间、地点、人物、事物、事件、现象和场景"七要素"的信息表达体系,并从地理语义、空间位置、几何形态、属性特性、要素关系、演化过程、作用机制7个地理维度上对其进行解读。实现了地理学视角下对地理信息内涵的全方位分类和描述,为面向地理学综合集成研究的地理信息多维描述与计算分析提供理论支撑。  相似文献   

5.
模糊层次综合法在区域雷电灾害风险评估中的应用   总被引:1,自引:1,他引:1  
针对雷电灾害事故发生的随机性、复杂性和不确定性等特点,以及在雷电风险评估过程中存在的主观性,通过层次分析法确定风险因素权重,并运用模糊综合评估法,建立一种区域雷电风险的模糊综合评估模型。以某国际会展中心为例的评估结果表明,方法在区域雷电灾害风险评估分析中具有较好的针对性、准确性和实用性。  相似文献   

6.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

7.
"天地图"是国家地理信息公共服务平台建设取得的重要成果。它的开通标志着国家测绘地理信息局在转变测绘服务方式、提升测绘服务能力、推进地理信息产业发展方面迈出了至关重要的一步。"天地图"的建设采用了集成技术创新、服务模式创新、组织实施模式创新等策略,有效地利用、集成和优化各种资源,产生了集成效应。"天地图"刚刚起步,距满足用户需求还有很大距离。国家基础地理信息中心将在国家测绘地理信息局的领导下,大力丰富信息资源、提升服务能力,推进社会化应用,力争早日将"天地图"打造成为具有国际影响力的民族品牌。  相似文献   

8.
地理信息服务已成为分布式环境下获取地理数据的重要来源,从海量的网络资源中找到地理信息服务,是共享与互操作地理数据的基础。目前,地理信息服务主动搜索主要采用通用搜索引擎的接口或者通用爬虫的抓取方式,但这2种方式存在搜索效率低、搜索结果可用性差等不足。针对这一问题,本文设计了一种搜索地理信息服务的主题爬虫。该算法在最佳优先搜索的基础上进行了改进,综合考虑网页内容的主题相关度和链接文本的主题相关度确定链接优先级,优先爬取与地理信息服务相关的链接,并通过舍弃无关网页中的无关链接,减少无效爬取,进而提高搜索效率。此外,本文采用关键词匹配结合能力文档探测的方式识别地理信息服务,有效筛选出可用的地理信息服务,提高了服务搜索结果的可利用率。最后,本文以OGC WMS为实例,实现爬虫算法的原型系统并进行实验,实验证明该算法有效可行。  相似文献   

9.
分析了山东省1:1万基础地理信息数据库更新现状,阐述了1:1万基础地理信息数据库及时更新的作业方法、主要更新内容、技术路线,提出了及时更新质量保证体系及质量控制方法,从基础资料的获取与收集,变化要素属性信息的分析确定,矢量要素采集、更新的精度,矢量要素采集的方向,矢量要素采集、更新的完整性,矢量要素采集、更新的现势性,属性项赋值的正确、完整性,更新后要素的逻辑一致性等几个方面,阐述了生产作业中需要注意的环节,分析了产生质量问题的原因,并结合实际工作经验,提出了保障产品质量的几点建议。  相似文献   

10.
地理信息Web服务分散于表层网络和深层网络,给服务的查找和获取带来了困难。针对这一现象,研究设计开发了一个顾及深层网络的地理信息Web服务搜索系统。该系统以基于二级匹配的深层网络地理信息Web服务采集方法和顾及用户请求范围的地理信息Web服务检索方法为理论基础,以Lucene.net、Open Layers等开源插件为开发工具,实现了一站式的表层和深层网络服务采集和检索功能,为全球地理信息协作服务平台提供了更为广泛的数据基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号