共查询到20条相似文献,搜索用时 15 毫秒
1.
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。 相似文献
2.
中文文本的地理命名实体标注 总被引:1,自引:0,他引:1
通过文本中地理信息的语义解析,可以帮助人们深入理解空间认知和空间语言的表达规律,解决自然语言与地理信息系统(GIS)之间的语义障碍问题,提升GIS空间查询、空间推理、地理信息检索和地理信息服务的智能化水平。制定标注体系和建立标注语料库,能够发现自然语言中地理信息描述的语言结构,建立它们的元数据。本文在分析中文文本和GIS中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定了中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建了基于《中国大百科全书中国地理》(简称“GeoCorpus”)的大规模标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。 相似文献
3.
网络文本中蕴含着大量的交通信息,对交通命名实体识别是地情变化监测、交通实体更新的重要前提。针对交通命名实体识别任务中缺少专业标注数据和有效识别方法导致识别效果无法满足需求的问题,文中提出一种融合深度学习模型的交通命名实体自动提取方法。该方法首先利用语言表征模型充分融合语境来提取文本特征,然后通过结合双向神经网络模型来学习上下文语境,最终由条件随机场模型对输出进行约束得到全局最优标记序列实现交通实体的识别。实验证明,该方法准确率可以达到90%以上,能够实现对交通实体的有效识别。 相似文献
4.
针对传统测绘生产的矢量要素数据是二维形式,对现实世界的数字化抽象表达,难以完全满足在三维数字空间中分析、计算与使用的实际需要问题,该文以我国1∶50 000基础地理信息要素数据为主要数据源,研究设计国家级基础地理实体数据构建的生产流程与关键技术,并结合工程实践,详细阐述了地理实体数据转换重构、语义信息补充完善、实体语义关系构建等关键技术的实现过程。形成了一套切实可行的构建地理实体的工艺流程,较好地发挥了地理实体在信息承载、表达、共享和关联等方面的优势。首批国家级基础地理实体数据产品表明,该文阐述的生产流程可以快速有效地构建地理实体数据,可为国省市多尺度地理实体的衔接整合提供数据和技术支持。 相似文献
5.
知识服务是GIS的重要应用方向,海量文本数据中蕴含的丰富隐式地理信息的分析与挖掘成为热点研究问题。在自然资源管理领域,一定时空范围内的自然资源分布相对独立和分散,文本中的丰富语义信息零散、庞杂且高度非结构化,缺少有效的组织表达、关联整合与综合应用方案。本文面向自然资源管理领域的文本数据和自然资源实体,提出了语义驱动的地理实体表达框架,通过语义描述、空间位置、属性特征和时间演化四元组来组织表达文本内蕴的地理实体多域信息,并从概念、空间、属性和时间4个维度定义并表示实体间的多类语义关系;继而按照地理实体信息抽取、信息存储和语义关联构建等步骤,给出了多维度地理实体关联网络的构建方法,并设计了基于关联网络的知识问答服务算法;最后,以建设用地审批为例,利用审批过程电子文本数据,完成建设用地信息的实体化表达、建设用地实体关联网络的构建及知识问答服务的实现。试验与分析结果表明,本文的理论与方法能有效促进自然资源管理领域文本中地理信息的有机整合、充分关联与科学管理,为提升自然资源领域信息的应用与社会化服务水平提供切实可行的途径。 相似文献
6.
7.
《测绘文摘》2012,(3):83-90
CH20121724中文文本的地理命名实体标注=Annotation of Geographical Named Entities in Chinese Text/张雪英,朱少楠,张春菊(南京师范大学虚拟地理环境教育部重点实验室)//测绘学报.-2012,41(1).-115~120地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大 相似文献
8.
《测绘科学技术学报》2018,(6)
地理实体关系抽取是地理知识获取的重要组成部分。规则制定的繁琐和难以发现的隐式关系表达,使得现有规则匹配与机器学习的方法不能有效解决地理实体关系抽取中存在的中文文本语法结构复杂且地理实体关系显式与隐式表达并存的问题。因此,根据上下文反映显式或隐式地理实体关系的特征,提出利用实体词向量和句子语义向量从文本中抽取地理实体关系的方法。实验表明,利用该方法从网络文本中获取显式和隐式表达的地理实体关系具有较好的效果,在测试集中准确率和召回率可以达到75.2%和79.2%。本研究为构建地理知识图谱、地理信息检索以及地理本体学习提供方法支持。 相似文献
9.
新一代全空间信息系统提出了新的空间数据模型——多粒度时空对象模型,多粒度时空实体对象通过唯一实体标识、多元特征信息记录空间实体,能够较好地支持空间实体的空间和语义表达。矢量地图数据作为现有重要的基础地理空间数据,记录了地理实体具体属性和位置信息,为实体对象生成提供了强大的基础数据支持。本文提出了路网矢量地图数据生成实体道路对象的研究方法,通过地图数据特征分析、实体对象生成策略和关键技术研究、实体对象转换3个方面对矢量地图数据的实体对象生成展开研究,实验表明:本文提出的实体对象转换方法为矢量地图数据生成实体对象提供了一个可行的解决方案。 相似文献
10.
11.
12.
针对传统地图服务展示单一、信息固定,无法全面表达地理实体的多维度信息的局限,在深入分析地理实体特点的基础上,该文提出了一种“类血缘关系”地理实体服务与可视化方法,搭建面向城市服务的多表多维存储结构设计、模拟血缘关系构建地理实体检索与可视化方法,形成了集查询、检索和显示一体的全套解决方案,实现对地理实体的多角度展示和灵活扩展。基于上海国土信息平台的应用实验结果表明,该文设计的方法可以支持用户按需选择空间形态,灵活支撑各类融合信息的显示,进一步可按需组装提取用户所需作为信息分析和挖掘的基础。 相似文献
13.
14.
15.
地理实体作为时空信息云平台的基础数据,在城市信息化建设中发挥了重要作用,是智慧城市的重要组成部分.以地理实体为基础,可有效整合地理实体相关的专题数据,实现城市数据的一体化管理,形成时空信息云平台的资源服务体系.本文主要研究地理实体的数据获取、组织、更新、融合和智能化应用方面的内容,并以智慧柳州时空信息云平台为例,阐述地理实体在时空信息云平台建设和应用中的作用. 相似文献
16.
地理实体的数据处理技术在地理信息数据库建设中的应用 总被引:1,自引:1,他引:0
介绍了地理实体的概念和基本地理实体的内容,并对地理实体在地理信息数据库建设过程中的数据抽取、格式转换、数据装载等数据标准化的主要数据处理技术方法进行了陈述,为其它相关地理信息数据库建设项目提供基本方法参考。 相似文献
17.
首先分析了目前我国基础地理信息资源建设存在的主要问题,提出了通过构建地理实体数据库实现基础地理信息资源的共享和深入应用的构想。其次,深入分析了目前国内外地理实体数据库的研究及建设现状。在以上基础上,最后以优先满足国家事权为原则,提出了基于地理实体数据采集的我国基础测绘国家、省、市县任务分工和生产组织模式构想。 相似文献
18.
19.
大规模城市三维建模一直是三维城市建设发展的关键,本文按照基础数据的分类方法,研究地理实体要素中各类模型构建规律,抽象出点、线、面状要素,利用符号匹配、规则构建及三角网构建方式进行批量建模。该方法实现了对地理实体要素三维表达的快速构建,具有较强的实用性。 相似文献