首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。  相似文献   

2.
杨盈  邱芹军  谢忠  田苗  郑诗语  郑帅 《测绘通报》2023,(8):155-160+177
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。  相似文献   

3.
针对建筑物实体的快速融合构建模式,实现场景数据的结构化和语义化,是目前自然资源部和各新型基础测绘试点城市研究的重要内容。该文提出了一种基于不动产测量成果构建建筑物房屋、层、户实体的方法。以不动产测量图元为基准,基于业务规则对图元进行定性描述并编码,并变换成竣工验收测量图元,解决了在构建实体数据时提取不同专题要素间数据的关联关系问题;通过解析图元编码,可快速识别图元的语义,实现对构成实体的图元要素快速提取和按规则高效融合。实验结果表明:该方法不仅有效解决专业测绘数据自动适配组装基础测绘建筑物实体数据的问题,同时以不动产登记业务和工程项目竣工验收业务为驱动,解决了数据更新及时、动态持续的问题。  相似文献   

4.
中文文本的地理命名实体标注   总被引:1,自引:0,他引:1  
通过文本中地理信息的语义解析,可以帮助人们深入理解空间认知和空间语言的表达规律,解决自然语言与地理信息系统(GIS)之间的语义障碍问题,提升GIS空间查询、空间推理、地理信息检索和地理信息服务的智能化水平。制定标注体系和建立标注语料库,能够发现自然语言中地理信息描述的语言结构,建立它们的元数据。本文在分析中文文本和GIS中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定了中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建了基于《中国大百科全书中国地理》(简称“GeoCorpus”)的大规模标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

5.
《测绘文摘》2012,(3):83-90
CH20121724中文文本的地理命名实体标注=Annotation of Geographical Named Entities in Chinese Text/张雪英,朱少楠,张春菊(南京师范大学虚拟地理环境教育部重点实验室)//测绘学报.-2012,41(1).-115~120地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大  相似文献   

6.
随着互联网应用的发展,所产生的非结构化文本大多与地理位置相关联,因此,地理信息检索(GIR)成为当前GIS和IR领域研究的热点。文本地理编码是建立文本与地理位置坐标对应关系的过程,是实现GIR的基础。本文对文本地理编码涉及的地理实体识别、地理实体消歧、文本位置聚焦、区域语言建模等关键技术进行分类总结,提出了该领域未来研究工作和面临的挑战,为文本地理编码进一步相关研究提供新思路。  相似文献   

7.
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预处理工作的基础上,提出了一种顾及新闻结构的方法消除语义干扰等噪声的影响;通过引入虚父节点构建合理准确的隶属关系地名树,结合最小包围盒的概念实现了最佳空间尺度的选取,使用地名实体权重和实体相关性完成了事件地候选集推荐排序,从而合理定位事件发生地。实验证明,所提出的新闻文本地理信息抽取方法可以较高的准确率获取新闻所对应的最佳空间尺度和相应的事件地点。讨论和解决了新闻文本地理信息抽取涉及的空间尺度问题,使得新闻文本中抽取的地理信息具有更好的可用性和可解释性,在丰富地理信息数据来源的同时,可实现数量呈几何级增长的网络新闻自动地域划分,有助于人们对各类事件空间态势的关注与认知。  相似文献   

8.
叶亚琴  陈波  万波  周顺平 《测绘科学》2012,37(6):101-103
空间实体匹配过程中多个指标的融合问题是影响匹配效果的关键问题之一。本文针对这一问题,以区实体为例提出了一套基于范例库的解决方案。首先提取出影响实体匹配的数据特征因子并确定了量化方法,其次选取典型的匹配指标,接下来通过建立指标权值范例库确定各指标权值,最后根据权值和数据特征因子调整匹配过程。该方法使得数据具有学习能力,达到了指标权值的自适应性的目标。实验表明该方法可行,并且可以提升空间实体匹配算法的效率、准确度和智能化程度。  相似文献   

9.
针对行业专题数据实时空间化及深度融合应用需求,本文提出了基于统一地名地址的地理实体自动赋码关联系统建设,构建地理实体与统一地名地址数据关联体系,设计了服务接口、计算提取、语义关联、手动识别等系统核心模块,形成了完整系统技术框架,通过地理实体编码构建形成“块数据”,实现了各行业数据逻辑汇聚,为推进行业数据跨地域、跨部门有效便捷共享提供了技术支撑。  相似文献   

10.
根据现有三维数据模型和地籍数据特点,在分析实体(E)和四面体格网(TEN)的基础上,对三维地籍实体信息组织进行研究,提出了基于实体-四面体格网模型(E-TEN模型)的三维地籍数据模型,其核心思想是实体作整体结构,TEN做局部结构。在数据结构中,通过特定方式(特殊属性值CX)将二者结合在一起。该模型能够实现地籍实体对几何、属性等综合信息的一体化组织,有利于实现复杂三维地籍实体三维空间数据的有效组织与管理。  相似文献   

11.
地理实体关系抽取是地理知识获取的重要组成部分。规则制定的繁琐和难以发现的隐式关系表达,使得现有规则匹配与机器学习的方法不能有效解决地理实体关系抽取中存在的中文文本语法结构复杂且地理实体关系显式与隐式表达并存的问题。因此,根据上下文反映显式或隐式地理实体关系的特征,提出利用实体词向量和句子语义向量从文本中抽取地理实体关系的方法。实验表明,利用该方法从网络文本中获取显式和隐式表达的地理实体关系具有较好的效果,在测试集中准确率和召回率可以达到75.2%和79.2%。本研究为构建地理知识图谱、地理信息检索以及地理本体学习提供方法支持。  相似文献   

12.
为了提高地貌识别精度,本文基于深度学习融合多种模态地貌数据的特征对地貌进行识别。该方法利用深度学习网络分别从晕渲图、高程和坡度3种数据中提取地貌的物理和视觉特征,然后采用残差学习模型挖掘不同模态特征之间的深度关联,对多模态地貌数据特征进行学习并融合生成地貌深层特征,从而实现对地貌数据的联合表达。最后,使用3个全连接层和一个SoftMax分类器为每个样本数据生成一个地貌类别标签。实验结果表明,与以往的方法相比,基于深度学习的多模态地貌数据的地貌识别具有更好的性能。  相似文献   

13.
基于手机信令数据的用户轨迹行为分析已广泛应用于交通监测、城市管理、人口分析等多个业务领域。针对手机基站定位与用户实际位置存在偏差且驻留轨迹缺失语义信息的问题,本文提出了一种基于地理信息的手机信令数据用户定位方法。该方法首先构建面向轨迹分析的地理实体数据采集规范;然后对手机信令数据进行聚类,建立地理实体与基站的权重映射关系;最后使用时空推理及对轨迹的深度学习技术,将用户有效驻留轨迹点拟合至实际的地理实体,实现用户定位。验证结果表明,该方法提升了用户定位的准确度,为后续业务场景的应用提供了可靠的数据支撑。  相似文献   

14.
语义相似性度量是实现多源矢量空间数据集成与融合的关键技术。首先以地理实体为研究对象,从矢量空间数据表达视角对地理实体的语义信息进行分析与描述,提出基于多特征约束的语义相似性度量模型。然后该模型将地理要素分类关系作为控制条件提取目标实体集,在构建实体间语义特征对应关系的基础上引入属性特征熵的概念,计算不同特征的权重值,进而综合多特征相似性来度量地理实体的整体语义相似程度。最后将该模型应用到道路实体匹配实验中,通过计算实体之间的语义相似性实现匹配,验证了该模型的有效性。实验结果表明,基于多特征约束下的语义相似性度量模型能够合理计算地理实体的语义相似度,且提高了地理实体语义匹配效率。  相似文献   

15.
现有基于网络测量的IP定位方法往往难以给出带有准确经纬度信息的可靠定位结果,通常仅能确定目标可能所处的大致区域(本文称为缓冲区),定位精度难以满足实际应用需求。针对该问题,本文提出了一种基于概率主题模型的网络定位结果优化方法。该方法首先从爬取的与网络实体相关的文本信息内容中,利用概率主题模型LDA的弱监督主题分类思想,提取与地物类型相关的从属主题;其次,根据提取的从属主题,确定实体可能所属地物类型;最后,将网络定位结果缓冲区与地理图层进行叠加,在叠加范围内检索所属类型的地物,确定实体的地理位置,从而完成文本主题与地物类型的匹配,实现对原有定位结果的优化。对仿真数据的测试结果表明,该方法能够在原有网络定位结果的基础上进一步缩小网络实体资源所处空间分布范围,证明了该方法的有效性。  相似文献   

16.
提出了一种用于空间数据整合的建筑物面实体对齐方法,可用来改善空间数据的位置精度。首先,采用基于最小外接矩形(minimum bounding rectangle,MBR)组合优化算法的匹配方法识别整合数据之间的同名实体;然后,提出基于几何相似性的成对约束谱匹配算法检测1:1、1:N和M:N同名实体之间的共轭点对;针对1:N和M:N匹配中不可避免存在弱对应点对和错误对应点对的问题,提出基于IGG1权重的最小二乘法来有效对齐同名实体。将所提出的方法应用于对齐较高位置精度的基础测绘地图数据和较低位置精度的谷歌地图数据中,结果表明,该方法不仅可检测存在复杂轮廓对应的1:N和M:N同名实体的共轭点对,而且可实现它们之间的有效对齐,使同名实体的位置信息差异最小化。  相似文献   

17.
李鹏飞  张亚  孙钦珂 《测绘科学》2021,46(9):178-183
针对POI数据的匹配更新工作成为目前各大地理信息服务平台亟需解决的问题,该文通过对POI数据的名称、地址及经纬度等主要属性的研究,提出了一种基于多属性综合相似度计算的同名POI实体识别的方法,能够有效解决多源POI数据的匹配更新慢及准确率低的难题.实验证明,相比于传统的文本相似度匹配方法,提高了POI数据的同名实体识别效率及精度.  相似文献   

18.
朱鹏  石丽红  焦明连  刘晓东  孙浩 《测绘科学》2021,46(11):159-165
针对互联网媒体数据中地名信息表达不规范、实体边界不清晰、地名简化表达问题,该文提出了一种混合神经网络的中文地名识别方法.通过ALBERT层学习字级别特征表达与BiLSTM层提取文本上下文语义特征,由CRF层获得全局最优标记序列,更有效地识别并提取中文地名.数据测试表明:相较于BiLSTM的地名识别模型,本文模型精确率提高12.89%,F1值提高10.83%;相较于BiLSTM-CRF的地名识别模型,本文模型精确率提高3.56%,F1值提高2.1%;相较于ALBERT-CRF的地名识别模型,本文模型精确率提高1.22%,F1值提高0.72%.  相似文献   

19.
知识服务是GIS的重要应用方向,海量文本数据中蕴含的丰富隐式地理信息的分析与挖掘成为热点研究问题。在自然资源管理领域,一定时空范围内的自然资源分布相对独立和分散,文本中的丰富语义信息零散、庞杂且高度非结构化,缺少有效的组织表达、关联整合与综合应用方案。本文面向自然资源管理领域的文本数据和自然资源实体,提出了语义驱动的地理实体表达框架,通过语义描述、空间位置、属性特征和时间演化四元组来组织表达文本内蕴的地理实体多域信息,并从概念、空间、属性和时间4个维度定义并表示实体间的多类语义关系;继而按照地理实体信息抽取、信息存储和语义关联构建等步骤,给出了多维度地理实体关联网络的构建方法,并设计了基于关联网络的知识问答服务算法;最后,以建设用地审批为例,利用审批过程电子文本数据,完成建设用地信息的实体化表达、建设用地实体关联网络的构建及知识问答服务的实现。试验与分析结果表明,本文的理论与方法能有效促进自然资源管理领域文本中地理信息的有机整合、充分关联与科学管理,为提升自然资源领域信息的应用与社会化服务水平提供切实可行的途径。  相似文献   

20.
针对当前道路实体建模中复用性低、方法固化、组织管理不规范的问题,提出了一种参数化道路实体建模方法。选取潍坊和青岛两个城市的部分地区为测区,基于航空影像数据、道路实体参数、CityGML标准实现道路实体参数采集、表达和组织管理;在多层次语义规则约束下构建道路图元三维模型,确保道路三维模型的建模的精确性;基于多边形裁剪算法实现道路实体三维模型与城市场景的融合。实验结果表明,该文提出的参数化建模方法能够清晰、准确、规范地构建出城市道路实体的三维建模,即使对于道路交叉口同样能够准确表达。其最终模型几何效果、模型复用性和后续模型修改灵活度均优于倾斜摄影模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号