首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

2.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

3.
网络文本蕴涵地理信息抽取:研究进展与展望   总被引:1,自引:0,他引:1  
互联网的普及产生了大量蕴含着丰富地理语义的文本,为地理信息的深度挖掘和知识发现带来了巨大机遇。同时,蕴含地理语义文本的异构性和动态性,使得地理实体的属性数量和种类激增、地理语义关系复杂,对地理信息检索、空间分析和推理、智能化位置服务等提出了严峻的挑战。本文阐述了网络文本蕴含地理信息抽取的技术流程,从地理实体识别、地理实体定位、地理实体属性抽取、地理实体关系构建、地理事件抽取5个方面总结了网络文本蕴含地理信息抽取的进展和关键技术瓶颈,分析了可用于网络文本蕴含地理信息抽取的开放资源,并展望了未来的发展方向。  相似文献   

4.
网络文本蕴含大量隐式地理空间信息,为地理知识获取与知识服务提供了巨大潜能。地理知识图谱是将传统地理信息服务拓展到地理知识服务的关键,也是网络文本蕴含地理信息采集与处理的终极目标。本文系统评述了开放地理语义网、开放地理实体及关系抽取、地理语义网对齐、知识图谱存储方法等地理知识图谱相关主题的研究进展,从网络文本蕴含地理空间信息量与质量评价、地理信息语义理解、空间语义计算模型和异构地理语义网对齐等方面剖析了目前亟需解决的关键科学问题。  相似文献   

5.
命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:(1)与无词汇增强功能模型...  相似文献   

6.
以图结构表达的知识图谱不仅在语义网络的描述与推理中发挥着重要作用,对于空间实体的结构化抽象与空间推理也具有重要意义。空间实体的联系信息在知识图谱中以图的边记录,通过路径探测、子图对齐、模式发现等基于边的知识图谱计算推理,在空间场景认知可发挥重要作用。地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,既有通用知识的内涵与特点,也有地理知识特定的时空特征,能够将语义模型和时空模型联系起来,描述语义关系、空间关系和时间关系,在地理知识的表达、理解、获取与推理方面有巨大的应用潜力。现有地理知识图谱的研究工作多集中于语义方面,语义关系的抽取与表达比较丰富,可以支持进一步的地理知识语义搜索等功能;然而地理知识图谱在时空模型上的知识表达比较缺乏,现有的空间关系局限在要素之间,很少涉及空间认知中进一步的分布态势、空间格局等,地理知识图谱在空间语义知识方面有待增强。本文基于知识图谱构建原理,以建筑群地理知识图谱构建为例,实现格网型建筑物模式的识别。先将建筑物抽象成实体,表达为图的节点,基于几何邻近分析提取建筑物之间的空间邻域关系,以此构建建筑群地理知识图谱;在此基础上结合建筑物模式...  相似文献   

7.
湿地作为地表覆盖类型的一种,对于生物多样性与气候变化有着重要的意义,也是人类的基本生存环境之一。为更好地理解和表达湿地知识及分类间关系,本文提出了一种基于本体的湿地知识图谱构建方法。首先,利用GlobeLand30数据、生态地理分区数据,围绕湿地类型、特征分布等要素分析湿地领域知识,提取知识间的语义关系,通过本体建模形成湿地知识图谱的概念框架;其次,融合百度百科数据等进行湿地实体的提取、属性信息抽取,丰富湿地知识图谱的数据层;最后,使用图数据库Neo4j存储实体关系和实体属性,实现了湿地知识图谱构建。本文构建的知识图谱扩充了湿地实体的概念描述信息,探索了顾及时空特征的湿地知识表示方法,为地表覆盖领域的知识图谱构建提供了一个应用范例。  相似文献   

8.
地理信息的不断泛化对经典的地理信息分析模式提出了巨大挑战,网络化的知识服务将逐渐成为地理信息应用的新模式,助力地理计算到社会计算的形态转变。地理知识服务需要打通人、机构、自然环境、地理实体、地域单元、社会事件之间的关联,促进知识辅助下的数据智能与计算智能。本文聚焦地理时空知识获取与形式化表达及分析的迫切需求,首先分析了时空知识图谱的基本概念与特征,认为时空知识图谱是指具有地理时空分布或位置隐喻的知识构成的有向图,即以时空分布特征为核心的知识图谱;然后提出了时空知识图谱的研究框架,该框架可实现时空大数据到时空知识服务应用的转变,包括泛在时空大数据、时空知识获取、时空知识管理、时空知识图谱、软件系统及行业应用等多个层次;接着从文本描述地理信息抽取、异构地理语义网对齐、时空知识表达与表示学习等方面,介绍了相关研究进展;结合应用实践,介绍了面向行业的时空知识图谱构建与应用途径;最后,讨论了时空知识图谱研究目前面临的关键科学问题与技术瓶颈,提出在大模型时代,构建显式的时空知识图谱,并针对行业需求开展知识推理,仍是时空知识服务的必由之路。  相似文献   

9.
随着气候变暖加剧,全球极端天气事件频发,重大气象灾害的发生频率与日俱增。研究气候变化与气象灾害发生频率的关系,对于气候变化背景下的防灾减灾具有重要意义。文献资料及泛在网络数据中蕴含了海量的气象灾害时空事件,为此,本文基于自然语言处理技术研发了文本气象灾害时空事件自动抽取方法。① 提出了基于专业文献的由粗到精的气象灾害标注语料训练库构建方法。首先针对不同文献资料存在的歧义和不兼容等问题,构建了面向文本事件统一的气象灾害知识体系。然后构建了基于章节结构的粗标注方法,分别针对长文本(现代文)和短文本(文言文)研发了基于Labeled LDA模型及基于TF-IDF和N-gram模型的精细标注语料筛选方法,解决了语料库的快速构建问题;② 基于BERT-CNN模型研发了融合上下文语义特征和多粒度的局部语义特征的、面向长短文本一体化处理的气象灾害时空事件自动分类方法;③ 利用该方法分别从文言文和泛在网络数据中自动抽取了灾害时空事件,其宏F1值分别达到89.09%和80.06%,主要气象灾害时空事件分布与专业统计数据相关性较高;④ 基于以上结果,重建了我国各历史时期灾害时空演变过程,发现各时期灾害数据量整体呈现出逐步上升趋势,暴雨灾害、洪涝灾害与干旱灾害是影响我国的主要灾种。本方法既可实现网络长文本事件的自动发现,也可实现文言文短文本事件的自动检测,为文本数据便捷应用于气象灾害研究和监测提供了新的技术方法。  相似文献   

10.
“地、物、化、遥”等地质矿产勘查和科研工作建立了海量的矿产调查数据,蕴含丰富的成矿构造背景、产出地质环境、矿床地质特征、矿床成因模式等与成矿和分布相关的知识。海量矿产资源相关数据向有效成矿规律知识的转换,已逐渐成为提升地质找矿精度的突破口。本文引入知识工程中本体知识表示技术,开展金矿知识图谱构建方法研究。首先,梳理了金矿成矿模式,确定了金矿概念、金矿实体以及地质特征、成矿特征等属性,运用自顶向下的领域本体知识表示方法构建金矿知识图谱的模式层;其次,基于结构化、半结构化和非结构化的多源异构地质数据源,采用深度学习模型实现金矿信息提取和语义解析,丰富金矿知识图谱的数据层,采用自底向上的方式构建金矿知识图谱;最后,基于图数据库开发了金矿知识管理系统,实现金矿数据管理、知识获取、金矿知识可视化表达、知识库管理、金矿找矿知识查询等功能。本文研究成果可形成“数据-知识”联合驱动的金矿找矿方法,为地质勘查工作中识别、控制和管理矿产资源、提升找矿精度提供参考。  相似文献   

11.
现代战争的军事作战数据来源广泛多样,目前对于军事作战的数据模型研究主要针对其时空属性进行描述,对于作战实体的多样化特征缺乏完整的表达,难以挖掘多维度的作战信息。多粒度时空对象建模是依照多粒度时空对象数据模型框架,将时空实体简化和抽象为数据模型,对复杂的现实世界进行概括与表达。本文在分析作战实体信息和特点的基础上,依托多粒度时空对象建模的思路,建立作战实体对象类并构建作战对象模型,对战争中时空实体的关联关系、组成结构和行为能力等特征的抽象与表达进行了探索,全面多维地描述作战实体及其特征变化,并以阿富汗战争中的美军凯克提特遣队为例进行对象化建模与可视化实现。实验结果表明,多粒度时空对象建模方法能有效表达作战实体的多维特征,在战场信息挖掘上具有精确立体、全面多维的优势,为面向对象的精细化作战研究提供了理论基础。  相似文献   

12.
知识图谱广泛应用于人工智能领域,基于此融合多源地理空间数据并表示地理事物的语义和时空信息,实现“数据—知识”的转换成为人们关注的热点。但现有通用知识图谱的空间知识覆盖度低且存在错误,同时基于维基百科构建的地理知识图谱存在空间关系、中文属性和坐标信息等属性缺失问题。因此本文以地理空间数据和百度百科数据的特征分析为基础,提出了以地理空间数据提取地理实体为主,百度百科补充属性信息为辅的知识图谱构建方式。① 基于GeoSparql设计模式层的地理实体、要素、几何形状和空间关系的逻辑关系;② 通过地理实体提取、实体链接和属性信息填充,在数据层实现空间知识融合;③ 结合关系型数据库和图数据库,设计空间知识存储方式;④ 在实体和关系2个方面定量分析知识图谱的构建规模。结果表明,本文构建的知识图谱中地理实体覆盖度和链接百科成功率相对较高,扩充了地理实体的概念描述信息,并将地理坐标的覆盖率提高到100%,对地理数据到地理知识的拓展具有重要意义。  相似文献   

13.
地学专家系统的知识化数据模式研究   总被引:1,自引:0,他引:1  
介绍了地学专家系统的知识化数据结构的设计原理与实现方法,采用知识表示的框架网络结构描述地理环境的实体单元,将各级专家知识的表示以指针链接,形成了由知识到语义的框架网络。采用了基于知识的扩展R-F 关系数据模式进行专家知识的表示,并讨论了系统知识库的组织结构和推理机的设计原理。该数据结构可以实现地理实体及其相互关系的完整性描述,并使系统知识库的操作简便易行,保证了推理机的实现。以乌鲁木齐河流域为试验区,阐述了流域土地合理利用规划决策专家知识的表示方法,以及专家知识表示的基本规则和系统专家知识的组织方式。此外,还讨论了系统推理机推理规则的设计原理与组织方法及推理算法。  相似文献   

14.
黄土高原地貌形态图谱三维符号指标体系与应用   总被引:2,自引:1,他引:1  
长期以来,地貌学界和制图学界一般是采用文字、地图和图像等方式来描述黄土高原独特的地貌形态,故往往不够形象,缺乏系统性。采用地学信息图谱和三维可视化的方法,对挖掘揭示黄土高原地貌形态特征规律是一个有效的方法。黄土高原地貌形态图谱三维符号的指标体系,是将地貌学家和制图学家对黄土高原正负地貌类型的认知结果经过系统化、标准化和科学化的归纳和提炼,从中提取出的描述黄土高原地貌三维特征的参数集合。既是对黄土高原地貌形态图谱三维立体特征的充分概括,又是三维形式建模表达的参考和依据。根据黄土高原地貌类型的分类和侵蚀特征规律,该体系分为正地貌形态指标体系、负地貌形态指标体系和坡度一侵蚀特征谱系描述指标,采用定性和定量相结合的方法来制定指标体系的具体参数。最后通过实例来验证指标体系在构造三维符号时的应用。细致精确的描述单个地貌类型的三维形态,将有助于对黄土高原地貌特征的认识和研究,为水土保持和生态环境建设提供帮助,同时也为其他地貌类型的信息图谱研究提供借鉴。  相似文献   

15.
日常生活中人们使用定性的自然语言描述地理实体,如何将定性描述的地理实体转换为定量的图形符号是空间认知、地图表达等领域面临的挑战。本文提出一种基于自然语言形态描述的地理实体表达方法,通过对自然语言中地理实体的语义信息进行分析,对自然语言描述的地理实体的形状、大小、分布状况等空间形态信息以地图形式进行近似表达。本文首先阐述了自然语言形态描述的定义与内涵,结合地图符号相关理论,研究了形态描述驱动的地理实体模拟表达策略,并对不同语义模糊度的地理实体图形表达进行了分析和实例设计,最后提出了一种计算空间实体相似性的方法对表达效果进行评估。结果表明,基于本文方法的地理实体模拟表达与手绘图中地理实体的平均相似度达到89.5%,与导览图的地理实体平均相似度达到86.86%,能够实现较好的表达效果,具有一定的科学性和可行性,为自然语言到地图语言的转换研究奠定了基础。  相似文献   

16.
根据全空间信息系统中地理实体基本特征以及存储管理的需求,本文提出了一种面向地理实体及其关联关系动态变化表达的时空数据模型。① 在地理实体方面,将其抽象为由有序、无缝对象片段组成的时空对象,并建立了对象片段表达的三元组模型,即空间位置、几何形态和属性特征;② 在关联关系方面,采用基于RDF模型来对空间关系和属性关系进行形式化描述;③ 在动态变化方面,将地理实体的变化分为空间位置的变化、几何形态的变化和属性特征的变化,关联关系的变化分为空间关系和属性关系的变化,并分别采用快照/增量、方程/模型2种方式来统一表达它们的离散和连续变化。该模型可显式地描述动态的时空对象及其关联关系在时空过程中的变化,有助于探讨和挖掘地理现象的基本变化规律和内在关联性。  相似文献   

17.
 数字地形编辑是虚拟地理环境、三维景观仿真系统中一个重要的研究内容,在城市与乡村、区域道路网、风景园林的数字化规划设计实践中具有重要价值。本文以规则格网的数字地形为研究对象,面向城市和园林景观规划设计中的实际应用,提出了交互式数字地形编辑的解决方案,重点给出了分页技术的地形交互式编辑具体过程和相关的主要实现技术。数字地形编辑的实现,首先,通过鼠标交互式操作,结合射线求交算法,在地形表面选取目标编辑区域;然后,结合夹角之和检测算法,获取区域下地形数据,设定新的地形高程值,最后,将编辑操作传输至地形其他层,更新整个地形,并在地形编辑后,采用方格网计算法,统计出区域下地形填挖方量。此外,在经过平整的地形区域,植入树和三维建筑模型,构建虚拟城镇小区景观。本文初步实现了编辑操作功能的计算机软件,并展示了数字地形编辑在城镇小区景观设计中的应用结果。试验表明,基于规则格网和分页技术的数字地形编辑方法具有算法简单、计算量小、易实现等特点。此外,通过鼠标交互式的操作,能够实时、直观地显示编辑结果,达到"所见即所得"的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号