共查询到16条相似文献,搜索用时 531 毫秒
1.
当前网络中地理信息以几何形式递增,为了高效地从海量网络信息中检索出高质量的地理信息,本文提出了一种基于主题爬行的地理信息分布式检索方法。本文采用面向对象的方法将网络地理数据按照四元组的要求进行分解和组织,对地物实体的主题文本特征、地理空间特征、时间维特征等相关信息进行封装,建立四元组实体对象,实现了地理信息数据的相互集成与组织。引入MapReduce模式的并行处理机制完成对网页中地理信息数据的优化存储与索引,并且通过分别计算网页文本、地理文本与查询关键词的主题相关性对爬取的网页进行有序的排列,从而提供快捷、高效的地理信息主题查询。 相似文献
2.
在地理信息资源检索应用中,资源属性间相似关系的计算还不够深入,地理信息资源的精准推荐及检索可视化应用尚难以实现。针对该问题,统一采用"相似度"对资源属性间的相似关系进行表达。资源的属性类型大部分为文本,其中具有语义差异,文中提出复合文本的相似度算法对文本类型属性进行匹配,并给出数值类型属性的"相似度"映射方案。在此基础上,实现资源时间、空间属性的相似度计算。基于所提出的相似度算法进行地理信息资源检索实验,实现地理信息资源属性间相似关系的量化,促进信息可视化在地理信息资源检索中的应用。 相似文献
3.
《北京测绘》2019,(12)
随着信息技术的飞速发展,网络信息日益丰富,尤其是地理信息,随之而来的地理信息检索技术逐渐成为地理信息科学领域的重要研究课题。传统的基于关键字语法匹配的信息检索技术,查询返回的结果往往存在很大的信息冗余,因此当人们出门在外需要检索地理信息时,为了从返回的查询结果中搜索到有用的信息,常常要耗费大量的时间。然而,引入基于本体(Ontology)的语义检索技术,通过定义明确的领域概念、属性和实例来建立领域本体及其推理机制,来发掘概念、实例之间隐含的信息,从而实现基于语义的智能地理信息检索,这无论对地理信息检索的效率还是准确率来言,都是极大的突破。本文以交通领域本体为例,并采用Protégé本体构建工具实现交通本体的构建。 相似文献
4.
中文文本的地理命名实体标注 总被引:1,自引:0,他引:1
通过文本中地理信息的语义解析,可以帮助人们深入理解空间认知和空间语言的表达规律,解决自然语言与地理信息系统(GIS)之间的语义障碍问题,提升GIS空间查询、空间推理、地理信息检索和地理信息服务的智能化水平。制定标注体系和建立标注语料库,能够发现自然语言中地理信息描述的语言结构,建立它们的元数据。本文在分析中文文本和GIS中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定了中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建了基于《中国大百科全书中国地理》(简称“GeoCorpus”)的大规模标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。 相似文献
5.
6.
地理信息分类体系转换对于实现异构地理信息系统之间的语义信息共享与互操作具有至关重要的作用.人工转换方法效果较好,但是对时间、经费和领域专家的要求较高.提出了一种基于字面相似度的地理信息分类体系自动转换方法,包括类别语义相度计算方法、类别转换模型和分类体系转换算法.实验表明,该方法能够比较有效地构建不同地理信息分类体系的类别转换关系,实现它们之间的自动转换. 相似文献
7.
面对万维网日益增长的地图信息查询需求,利用对行政区划、地理要素分类及用户添加等地理要素的语义信息进行辅助地图分类查询。根据相关的标准建立了中国行政区划本体和基础地理要素分类本体,将这两个本体存储到Oracle语义库中,采用SPAQEL完成语义信息查询,以提高地理要素检索的智能性。最后,通过建立的原型系统进行查询试验,验证了语义信息辅助地图分类查询可以提高信息检索的查全率和查准率。 相似文献
8.
由于网络地图服务(Web map service,WMS)元数据缺乏显式的领域主题描述机制,用户很难准确、全面地发现目标领域的地图数据资源。提出了一种面向地理信息资源检索的WMS领域主题文本提取及元数据扩展方法。首先,设计了一种非监督文本分类算法,利用地球与环境术语集语义网(semantic Web of Earth and environmental terminology,SWEET)和大型英语词汇语义网WordNet,综合计算WMS元数据能力文档中地学术语、通识型词汇与领域主题的语义相关度,为WMS及其图层提取多标签主题。然后,基于ISO19115 2003地理信息元数据标准,为WMS元数据组织模型扩展领域主题。实验结果表明,所提出的WMS元数据主题分类算法取得了较高的查准率和查全率,且相较于朴素贝叶斯、线性支持向量机(support vector machine,SVM)和逻辑回归等方法,整体上有较大的优势。该方法有望应用于当前的地理信息门户和目录服务,辅助用户快速、准确地定位目标领域的地图服务资源。 相似文献
9.
10.
11.
点状地名信息的加权泰森多边形检索法 总被引:1,自引:0,他引:1
鉴于地名库中多数地名仅以中心点坐标形式记录其空间位置信息,缺乏其空间范围的具体描述,造成地名检索中的片面性和局限性,本文在深入分析地名及其空间属性、空间关系的基础上,考虑同类型地名的不同性质在检索中的重要作用,利用泰森多边形在地名边界近似中的优势,提出了针对点状地名信息的加权泰森多边形检索法,依据同类型地名的面积属性作为权重指标构建泰森多边形,以近似表达地名的空间范围,进而描述地名间的各类空间关系;并从拓扑关系、方位关系与距离关系3个方面给出了具体公式以计算地名间的空间相似性;最后以行政区划边界近似与检索为例验证该方法。试验结果表明,该方法可较好地近似表达地名空间范围及空间关系,增强了检索词与地理信息资源在空间位置上的相似性度量,检索结果优于传统方法。 相似文献
12.
地名数据是一种重要的地理信息资源,目前我国的地名数据库建设多局限于国内地名,缺少国外数据。传统地名数据的检索多为关键字查询,查询效率低且无法用于复杂地名查询。文中提出一种基于开源地名数据库GeoNames和开源搜索引擎Solr的地名数据全文检索方法,通过分析GeoNames的数据类型和结构,构建MySQL地名数据库,并利用Solr建立地名索引,提供基于Web服务的地名数据全文检索。实验表明,基于Solr的地名数据全文检索能够显著提高地名数据检索效率,对于复杂地名查询,也能进行有效地检索。 相似文献
13.
14.
地名是最常用的社会公共信息之一,民政部门、国家地理信息管理部门和各省市都开展了地名数据库和管理系统的建设,形成了不同标准、不同结构的地名数据,给管理与应用带来困难。本文设计了多源地名数据管理模型,对地名数据按区域、按专题分层管理,利用开源信息检索工具库Lucene,设计了地名数据管理引擎,并利用多种地名数据进行了实验。实验结果表明,本文设计的地名数据管理模型可以实现多源地名数据的统一、高效管理与应用。 相似文献
15.
传统GIS中,文本常常被作为非空间信息而被忽视。而在实际应用中,很多有关空间位置的描述都是以文本途径来体现的。文本方式已经成为人们表达和接受空间信息的主要方式之一。地名是文本中最常见的空间信息表达内容。提出了一种基于文本地名自动识别的空间信息检索新方法,从自然语言形态的文本数据中实现地名的自动识别,并将识别的地名与空间数据进行关联显示,实现文本中地名信息的空间定位与显示。 相似文献