首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 687 毫秒
1.
网络文本蕴涵地理信息抽取:研究进展与展望   总被引:1,自引:0,他引:1  
互联网的普及产生了大量蕴含着丰富地理语义的文本,为地理信息的深度挖掘和知识发现带来了巨大机遇。同时,蕴含地理语义文本的异构性和动态性,使得地理实体的属性数量和种类激增、地理语义关系复杂,对地理信息检索、空间分析和推理、智能化位置服务等提出了严峻的挑战。本文阐述了网络文本蕴含地理信息抽取的技术流程,从地理实体识别、地理实体定位、地理实体属性抽取、地理实体关系构建、地理事件抽取5个方面总结了网络文本蕴含地理信息抽取的进展和关键技术瓶颈,分析了可用于网络文本蕴含地理信息抽取的开放资源,并展望了未来的发展方向。  相似文献   

2.
以图结构表达的知识图谱不仅在语义网络的描述与推理中发挥着重要作用,对于空间实体的结构化抽象与空间推理也具有重要意义。空间实体的联系信息在知识图谱中以图的边记录,通过路径探测、子图对齐、模式发现等基于边的知识图谱计算推理,在空间场景认知可发挥重要作用。地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,既有通用知识的内涵与特点,也有地理知识特定的时空特征,能够将语义模型和时空模型联系起来,描述语义关系、空间关系和时间关系,在地理知识的表达、理解、获取与推理方面有巨大的应用潜力。现有地理知识图谱的研究工作多集中于语义方面,语义关系的抽取与表达比较丰富,可以支持进一步的地理知识语义搜索等功能;然而地理知识图谱在时空模型上的知识表达比较缺乏,现有的空间关系局限在要素之间,很少涉及空间认知中进一步的分布态势、空间格局等,地理知识图谱在空间语义知识方面有待增强。本文基于知识图谱构建原理,以建筑群地理知识图谱构建为例,实现格网型建筑物模式的识别。先将建筑物抽象成实体,表达为图的节点,基于几何邻近分析提取建筑物之间的空间邻域关系,以此构建建筑群地理知识图谱;在此基础上结合建筑物模式...  相似文献   

3.
地理信息的不断泛化对经典的地理信息分析模式提出了巨大挑战,网络化的知识服务将逐渐成为地理信息应用的新模式,助力地理计算到社会计算的形态转变。地理知识服务需要打通人、机构、自然环境、地理实体、地域单元、社会事件之间的关联,促进知识辅助下的数据智能与计算智能。本文聚焦地理时空知识获取与形式化表达及分析的迫切需求,首先分析了时空知识图谱的基本概念与特征,认为时空知识图谱是指具有地理时空分布或位置隐喻的知识构成的有向图,即以时空分布特征为核心的知识图谱;然后提出了时空知识图谱的研究框架,该框架可实现时空大数据到时空知识服务应用的转变,包括泛在时空大数据、时空知识获取、时空知识管理、时空知识图谱、软件系统及行业应用等多个层次;接着从文本描述地理信息抽取、异构地理语义网对齐、时空知识表达与表示学习等方面,介绍了相关研究进展;结合应用实践,介绍了面向行业的时空知识图谱构建与应用途径;最后,讨论了时空知识图谱研究目前面临的关键科学问题与技术瓶颈,提出在大模型时代,构建显式的时空知识图谱,并针对行业需求开展知识推理,仍是时空知识服务的必由之路。  相似文献   

4.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

5.
网络文本是构建和填补大规模地理知识图谱的重要地理信息来源。但网络文本来源广泛、动态性强、表达方式复杂多样、蕴含地理信息良莠不齐,网络文本蕴含地理信息质量评估面临评估对象多层次、质量维度不明确、评估指标多元化、深层次指标难获取和评估方法多样化的挑战。因此,本文提出了一种网络文本蕴含地理信息质量评估框架(QAF-GIWT)。QAFGIWT面向网络文本获取地理信息过程,明确了数据源、数据项和数据集3层质量评估对象,针对不同层次评估对象定义了包含相关性、新颖性、可靠性和完整性4个质量维度和相应的量化评估指标,系统地梳理了质量评估过程中所涉及指标计算、指标综合和质量预测方法的特点及其适用性。其中,借助自然语言处理技术及相应的指标计算方法,构建了包含单元地理语义比率、地理语义含量比率、平均地理信息含量比率和地理信息含量比率、地理实体比率、窗口地理信息含量比率等指标。实验中针对马蜂窝等类型网站特性设计了QAF-GIWT框架,针对多层次质量指标的综合评估,采用了层次分析法进行可靠性综合评估,应用实验案例验证了QAF-GIWT框架的有效性。QAF-GIWT提供了一整套囊括质量维度、质量指标和质量评估方法...  相似文献   

6.
知识图谱广泛应用于人工智能领域,基于此融合多源地理空间数据并表示地理事物的语义和时空信息,实现“数据—知识”的转换成为人们关注的热点。但现有通用知识图谱的空间知识覆盖度低且存在错误,同时基于维基百科构建的地理知识图谱存在空间关系、中文属性和坐标信息等属性缺失问题。因此本文以地理空间数据和百度百科数据的特征分析为基础,提出了以地理空间数据提取地理实体为主,百度百科补充属性信息为辅的知识图谱构建方式。① 基于GeoSparql设计模式层的地理实体、要素、几何形状和空间关系的逻辑关系;② 通过地理实体提取、实体链接和属性信息填充,在数据层实现空间知识融合;③ 结合关系型数据库和图数据库,设计空间知识存储方式;④ 在实体和关系2个方面定量分析知识图谱的构建规模。结果表明,本文构建的知识图谱中地理实体覆盖度和链接百科成功率相对较高,扩充了地理实体的概念描述信息,并将地理坐标的覆盖率提高到100%,对地理数据到地理知识的拓展具有重要意义。  相似文献   

7.
地学知识图谱的定义、内涵和表达方式的探讨   总被引:1,自引:0,他引:1  
在地学图谱和地学信息图谱的基础上,本文提出了地学知识图谱的概念,并介绍了地学知识图谱的基本框架、特征和理论意义。地学知识图谱将地学知识以虚拟空间坐标的形式反映在地图上,用以展示地理对象特征空间分布,揭示出一些隐含的规律。它是对地理知识形式化的图形表达,具有语法和语义特征,因此,有可计算性。它的基本组成要素和结构由所表达的内容决定。地学知识图谱,不仅是一种知识表达和数据挖掘的手段,也是空间认知的一种方式和结果。  相似文献   

8.
知识图谱作为人工智能技术与应用中重要的数据基础设施,已经成为地理科学领域的一个研究热点。目前对地理知识图谱进行嵌入表达时通常使用默认的超参数(如2层网络搜索深度),但是部分地理知识图谱的网络规模和拓扑特征与通用知识图谱不同,其合理性需进一步论证。为此,本文围绕城市轨道交通人地关系,基于地铁线路网络的拓扑结构特征,结合客流数据、POI(兴趣点)数据以及建成环境数据等构建地铁出行知识图谱;利用GraphSAGE模型学习实体的多维度特征嵌入,并结合POI数据对站点分类结果进行语义识别,对比验证适合地铁出行知识图谱嵌入表达的网络搜索深度。不同于默认的2层搜索深度,当搜索深度为3层时,本研究所构建的地铁出行知识图谱的节点嵌入效果最优。因此,地理知识图谱嵌入表达的超参数选择需要顾及时空和人类活动相关的网络规模和拓扑特征,要避免不加甄别地使用其他领域通用知识图谱的已有成果。使用3层搜索深度获得的地铁站点分类结果也更具合理的解释性,可为利用知识图谱和人工智能方法进行站点规划和客流预测提供基础。  相似文献   

9.
随着地理信息服务应用领域和受众群体的日益广泛,人们对地理信息服务的需求越来越多元化。一方面网络上注册和发布的地理信息服务的数量急剧增长;另一方面人们对如何高效发现兴趣服务、组合兴趣服务以满足兴趣需要却常感到困惑。当前,用户只能通过关键字搜索并结合空间过滤条件查询OGC(Open Geospatial Consortium)的目录服务,来发现所需的数据和服务。用户在受益于目录服务带来的资源搜索便捷的同时,经常受到查全率和查准率不高的困扰。面对日益庞大的服务群,如何自动、快速、准确地发现目标服务,成为影响地理信息服务进一步发展与应用的瓶颈。本文围绕地理信息服务语义标注原理方法与关键技术展开研究,通过引入信息检索技术和语义网技术、语义服务技术,从面向地理信息服务语义标注的本体建模、基于地理概念匹配的语义标注算法、融合相似性度量与包含性推理的语义匹配与服务发现,以及语义标注和服务匹配质量评价方法4个方面进行了深入研究。针对地理概念半自动语义标注新算法、地理信息服务语义发现与匹配方法、服务语义标注和服务匹配质量评价、应用试验等具体研究内容进行了实验设计,并给出了需解决的核心问题,为当前地理信息服务匹配方法提供了新思路。  相似文献   

10.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

11.
本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征。在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名。最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性。  相似文献   

12.
三维虚拟地球的海洋信息适用性分析及原型研究   总被引:2,自引:0,他引:2  
分析了三维虚拟地球在海洋应用上具有的优势及可能面临的挑战的基础上,首次提出了一种结合网格、语义网等前沿技术和理念,利用三维虚拟地球实现三维虚拟海洋的技术方案;并按照SOA的多层次架构,采用XML的多源异构海洋环境数据快速交换、海洋环境信息服务快速封装与发布、海洋环境信息服务虚拟组织、远程可视化等关键技术,实现了海洋环境信息网格平台及网格前端门户系统--三维虚拟海样(VRMarine)。VRMarine不仅能够集成网格环境下多源海洋环境信息服务,再现逼真的三维海洋环境场景,同时,还支持对功能服务的动态集成,实现多维时空特征分析。研究表明,该方案是切实可行和有效的,对三维虚拟海洋具有一定的现实及指导意义。  相似文献   

13.
地理知识库是地理实体及其相互间关系的集合,对于智能搜索、问答、推荐等知识服务有重要的支撑作用。然而,已有的地理知识库由于来源、形式、构建者等的不同,在实体地名、空间位置、类别等方面存在“同义异形”和“同形异义”的语义异构现象,影响了地理知识库间的知识融合与共享。语义对齐是解决语义异构的一种有效方法,其中实体类别对齐是语义对齐的基础,对于提高实体地名和空间位置的对齐精度具有重要作用。现有的实体类别对齐方法主要采用传统的字符相似度和结构相似度等来度量类别的相似度,无法捕捉实体类别深层次的语义相关性,从而影响了类别对齐的精确性。因此,本文提出了一种基于词嵌入的地理实体类别对齐方法,采用词嵌入模型从语料中学习实体类别的语义信息,并通过词向量来表达,以此弥补现有方法存在的缺失,进而提升实体对齐精度。进一步地,通过通用语料与地理信息语料的融合,本文实现了词嵌入模型所用语料在地理语义方面的增强,从而更精准地度量地理实体类别间的相关性。不同地理知识库实体类别对齐的实验表明,本文提出的方法能够有效捕捉地理实体类别的深层次语义信息,其实体类别对齐的调和平均值(Fl)可达0.9568,有效提高了实体类别的对齐精度。  相似文献   

14.
本文针对物流空间信息Web服务所涉及的服务获取、集成和应用等主要问题,以OGC Web服务框架为基础,将空间信息服务延伸到物流领域,建立了物流空间信息服务集成体系结构和Web服务的集成模式,明确了物流空间信息服务体系的构成要素及其内在关系.在此基础上,扩展和细化了物流空间信息的服务元素,设计了Petri 网的服务组合模...  相似文献   

15.
地理信息公共服务平台建设与现代测绘服务模式   总被引:30,自引:1,他引:29  
空间信息的共享既是信息化社会对空间信息的要求,也是地理信息技术发展的必然趋势。本文论述了地理信息公共服务平台建设的目的和意义,对平台的内容、关键技术、基本功能和作用进行了系统性的介绍,对未来测绘从信息获取的内容和面向信息化社会的服务模式提出了新的思路。  相似文献   

16.
针对大型空间信息服务平台构建过程中的数据互联互通和信息集成问题,从集成框架体系结构、技术路线和关键技术3个方面进行研究,提出了分布式地理空间信息集成框架的5层体系结构模型和原子空间信息服务概念;通过研究分布式空间查询路由算法和虚拟四叉树模型等关键技术,探索实现分布式环境下的空间信息的互联互通.  相似文献   

17.
地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。  相似文献   

18.
地理信息共享与互操作技术及标准   总被引:6,自引:2,他引:4  
地理信息共享和互操作一直是地理信息系统技术要解决的关键问题之一,目前已经发展了多种技术和标准实现地理信息共享技术与互操作,其中基于网络服务方式的地理信息共享和互操作方法是目前公认的最好方法。本文分析总结数据格式转换、直接访问、基于网络服务标准的3种地理信息共享和互操作方式及其优缺点以后,详细阐述了基于网络服务技术实现地理信息共享和互操作需要遵循的地理信息标准,在此基础上分析讨论了地理信息网络共享和互操作的实现技术和基本步骤。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号