首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 867 毫秒
1.
中文地址分词是中文地址标准化的基础工作和地理编码的重要手段,同时也是中文分词和地理研究领域中关注的热点问题之一。针对当前中文地址分词方法缺乏地址层级切分和过多依赖词典和特征的问题,本研究结合四词位标注集和中文层级地址特点,构建针对中文层级地址分词的地址标注体系,并提出融合双向长短时记忆网络和条件随机场(BiLSTM-CRF)的中文层级地址分词模型。该模型既考虑了BiLSTM模型能够记忆上下文地址的特性,也保留了CRF算法可以通过转移概率矩阵控制地址标注输出的能力。针对该地址标注体系标注的训练地址样本,分别使用CRF、LSTM、BiLSTM与BiLSTM-CRF模型进行训练对比。结果表明:① 基于中文地址标注体系的模型分词效果更佳,地址标注更为精细,符合实际地址分布情况;② BiLSTM-CRF模型精确度达到93.4%,高于CRF(90.4%)、LSTM(89.3%)和BiLSTM(91.2%),其整体地址分词性能和各层级地址分词效果相对于其他模型更突出;③ 各模型分词性能与地址层级保持一致,即地址层级越高,分词效果越好。本研究提出的中文地址标注体系和分词模型为开展中文地址标准化工作提供了方法参考,同时也为进一步提升地理编码技术的精准度提供了可能。  相似文献   

2.
地理命名实体分类体系的设计与应用分析   总被引:2,自引:0,他引:2  
自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。  相似文献   

3.
地址匹配是地理编码的核心基础,本文针对现有地址匹配算法与地址数据库反馈交互局限性问题,提出词汇-结构-语义三层解构地址的匹配处理策略。词汇层通过地名词典和结合尾字特征的正则表达式定义粒度剖分规则,以地址词元素为基本单元完成词汇级别解析;结构层定义地址模式类型以实例化数据组织,完成顾及上下地址层级结构的模型匹配;语义层抽象地址语义形式化表达,实现融合深度语义的地址匹配。同时,本文在综合地址词元素筛选、地址层级结构剖分和地址语义理解基础上对经过完全解析的地址数据不断反哺作为数据参考,从而实现数据库支持下的算法逻辑绑定与结果集成。本文以浙江省湖州市德清县地址数据作为实例进行验证,实验结果表明,在低重复率的多次采样实验下,平均匹配率达到92.83%,正确率为95.37%;通过实例分析表明,本文方法在完善地址参考库的基础上改进算法性能和精度,能有效解决地址结构缺失和语义近似推断,适应多样地址类型。  相似文献   

4.
地址编码是指将地址映射成地理坐标的过程,它提供了一种把描述性地理位置信息转换成GIS地理坐标的方式。本文分析了当前标准规范中的地址编码规则,认为街道与小区等院落实体作为同级别的区域限定物弱化了街道的空间特征,并且在现有地址编码规则基础上提出了将街道前置作为区域限定物的地址编码改进方案;进一步,为了体现街道作为各类地理实体的空间参考基础,本文按照街道的前进方向,定义了在街道线性空间中的地理实体链表组织模型,实现了将相互独立的地址编码实体在街道中的串联组织,从而为今后地址查询中的参考定位提供了模型支持;最后,给出了街道两侧不同类型地理实体纳入街道地址编码实体链表的实例说明。  相似文献   

5.
基于地理语义的空间关系查询和推理   总被引:3,自引:0,他引:3  
地理空间中的地物,根据其本体类型具有不同的地理语义特征。受到地理语义的影响,人们在描述几何特征和关系相似的物体之间的空间关系时,所用的词汇是不同的。目前,人们在空间关系的自然语言查询方面的研究主要集中在空间关系描述、空间关系自然语言形式化表达、空间关系自然语言查询语句的转换,以及空间关系自然语言查询的查询接口等方面,没有考虑到地理本体的语义差异,这会使得空间关系的自然语言查询不能符合人类语言和认知的习惯。本文依据一些学者在空间关系的自然语言描述的形式化(主要是线和线、线和面等形状的空间地物之间的关系)研究的基础上,针对不同地理本体类型的空间地物和空间关系自然语言描述词汇之间对应的语义关系有所不同的特点,总结了自然语言词汇在描述空间关系时的对应规则,提出不同特征类型地物和描述词汇之间的规则库设计方法,并设计部分空间地物的规则实例。最后,结合空间关系判断函数,设计具体查询系统实践举例证明。  相似文献   

6.
在智慧城市建设中,部门的业务管理中蕴含了大量的社会经济数据,如何快速、准确地将这些信息空间化是进一步开展空间分析与应用面临的首要问题。地理编码正是解决这一问题的关键技术。从地址数据标准、地址数据库建设、地理编码引擎等方面进行全面研究,形成一套数据全面、功能实用、应用广泛的智慧重庆地理编码服务平台,为全市各职能部门和社会公众提供可靠、高效、准确的地理编码服务,建设成果已在测绘、工商、应急、人口等多个行业部门开展应用,效果显著。  相似文献   

7.
自然语言描述中蕴含丰富的地理空间信息,空间关系是自然语言描述中最重要的一部分,对理解整个描述语句起到决定性作用。但自然语言描述的不确定性、模糊性、灵活性等特征给计算机理解和处理自然语言增添了困难,因此建立定性的自然语言空间关系描述与定量的图形空间关系之间的映射关系是本文研究的重点。根据空间粒度的不同将自然语言空间关系描述分为完全模糊描述、区间模糊描述和定量模糊描述3类,提出缓冲区法和随机参数法2种可视化表达方法,并搭建原型系统进行实验。实验表明,该方法有效可行,有利于深化模糊语义的自然语言描述图形化研究。  相似文献   

8.
为了适应中文地址数据的复杂性,本文依据其中地址要素的层级关系,建立城市地址要素的树形模型,并提出基于地址树的文本自适应匹配方法,该方法根据地址数据中各部分地址信息匹配的节点评价选择最优匹配结果,通过单元最大长度匹配法获得地址树中与地址信息相匹配的节点,参照节点的层级关系构建相对独立的地址节,根据地址节中的地址信息计算权重因子,回溯评价返回最优匹配结果;本文采用深圳市518 948条建筑物地址数据构建城市地址树,在此基础上进行地址匹配试验,达到85.6%的匹配准确率,可应用于地址标准化和地址匹配流程中。  相似文献   

9.
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。  相似文献   

10.
针对目前地名地址编码存在的区位信息缺乏、编码粒度较粗、稳定性和可读性较差等问题,本文提出了地名地址编码设计的3个原则:(1)每个地名地址的编码独立且稳定;(2)编码易于实现;(3)编码便于识读。基于地球剖分理论,设计了一种多尺度的地名地址空间区位编码模型,该编码模型以地球剖分网格作为基础单元,建立地名地址空间区位属性与球面网格的映射关系。进一步提出了地名地址空间区位编码方法,该编码是由定位码、层级码和半跨度码组成的一维定长组合码,并且从空间位置、区域范围和空间关系3个方面分析了对空间区位编码的识读方法。最后,以物流行业为例,探讨了地名地址空间区位编码模型的应用思路与前景。结果表明,该模型便于计算机存储与管理,能够为地名地址的网格化管理提供组织与表达基础,对智慧城市建设具有很强的理论和实用价值。  相似文献   

11.
古代城市结构复原的GIS分析与应用——以北宋东京城为例   总被引:2,自引:1,他引:1  
空间综合研究方法在社会科学研究中越来越受到重视,GIS正成为一种新的历史学研究工具。本文以北宋东京为例,讨论了运用GIS进行古代城市结构复原可行性。基于开封市考古发现和历史文献研究成果,运用地图学方法、GPS、GIS技术,探讨了古代城市空间结构复原的基本思路、方法和操作步骤。东京城GIS的初步实现表明:以现有考古发现和文献研究资料为基础,在GIS环境中重现古代城市空间,可以整合历史学研究成果,不仅实现历史研究成果的共享,而且为历史学研究提供一个新方法。  相似文献   

12.
数字正射像片(digitalorthophtos)以其迅速、快捷的生产方式和详实、可靠的信息数据特性可以作为地理信息系统的一种新的信息源。本文论述了数字正射像片在地理信息系统中的应用,首次在矢量数据和栅格数据混合数据结构的图形工作站上,对数字正射像片应用于地理信息系统的原理、方法和数据流程进行了尝试。  相似文献   

13.
近年来,越来越多的历史、历史地理学者开始关注和使用GIS技术,在历史GIS数据库和信息系统研究和建设方面进行了大量的探索。但是,这些研究多是技术主导应用,对历史、历史地理信息的组织多是面向特定专题或应用,且通用性差,亟需遵循历史、历史地理学科的知识体系,发展历史GIS基础软件层面的通用数据模型。本文从地理与历史双重视角出发,以时间、地点、人物、事件(始末)历史4个要素为基础,融合地理学强调“人地关系”的思想,将历史信息抽象为历史人物、历史事件、历史地物和历史场景,以及关系和经历/过程等要素,提出并设计了一种基础的、通用的历史GIS数据模型,探讨了该数据模型的时空对象组成、时空对象的属性以及时空对象之间的关系,设计了时空对象的存储方案,并在应用系统中以典型历史人物、事件、地物和场景等要素的存储和可视化等为例,验证了模型的有效性。  相似文献   

14.
通过对人口管理数据的分类、组织方式和应用模式的探讨,以及对业务系统的人口数据管理、住址管理,以及相互关联关系的分析,利用GIS技术研究得出一种面向GIS的人口管理数据模型,基于该模型进行了人口业务管理信息系统和人口地理信息系统的功能开发。结果表明,该模型能够快速实现人口业务管理系统与人口地理信息系统的数据共享及集成应用,同时满足人口业务管理和空间管理需求。  相似文献   

15.
在社会经济统计GIS建设过程中,如何组织、访问和分析大量的社会经济统计指标,从中提取有用信息,是其难点之一。以往的社会经济统计GIS应用层直接访问数据库的形式,虽然在访问速度上存在一定优势,但是使用过程出现如下问题:(1)缺乏可管理性和适应性;(2)不能够适应数据层中数据结构和内容的变化。本文剖析了社会经济统计数据的组成和特点,提出采用元数据来组织社会经济统计GIS中海量的社会经济数据。在应用层与底层数据库之间加入元数据层,通过元数据解析引擎完成应用层到关系数据库,关系数据库到应用层的映射的系统数据组织方法。并以包头市青山区社会经济统计信息系统为例,说明了该方法的可行性。  相似文献   

16.
GIS与地下水数值模型集成中面向对象法的应用   总被引:2,自引:0,他引:2  
GIS与专业领域模型的集成面临着许多挑战,其中之一是GIS要适合专业模型的要求。地下水模拟模型需要一个专业的GIS数据结构,同时GIS应用的快速发展,为地下水资源管理提供了辅助决策功能。本文使用面向对象的方法(Object Oriented approach),建立地下水模拟概念模型和适合于地下水可视化模拟的GIS数据结构,并研究GIS与地下水模拟模型紧密集成技术。采用面向对象的思想,将数据、模型和用户接口统一集成到同一个GIS系统中,为模型管理和分析创造了充分的灵活性。  相似文献   

17.
时空数据模型及时空地理信息系统功能架构   总被引:1,自引:0,他引:1  
地理信息系统(GIS)就其实质而言,是现实世界的一种数据抽象模型。但现有的GIS数据模型缺乏跟踪现实世界实体变化的能力,因为它只保存实体的现势数据,而对于各种历史状态数据则无法保存,是一种快照数据模型。随着地理信息系统在行业应用的普及和深入,人们开始认识到地理信息系统应该具有描述现实世界中各种时空变化的能力,既可以分析其过去,又可以预测其未来(发展趋势)。这种想法导致了时空地理信息系统和时空数据模型概念的提出。本文分析了时空数据建模方面的技术问题;并讨论了主要的建模方法。认为历史接续关系和时序刻画是时空建模的主要内容。  相似文献   

18.
空间数据引擎关键技术与应用分析   总被引:8,自引:0,他引:8  
地理特征相关信息的一体化存储与访问是GIS软件平台研发的关键技术。在扩展关系数据模型的支持下,利用成熟的商用扩展关系型数据库管理系统存储和管理海量空间数据,是发展大型GIS平台空间数据库管理系统行之有效的技术方法。本文对几种典型的空间数据库管理平台ArcSDE、OracleSpatial、InformixSpatialDataBlade、DB2SpatialExtender和MySQLSpatialExtensions从存储模型、进程管理方案、空间查询和索引以及数据缓存技术等方面进行了分析。  相似文献   

19.
网格GIS体系结构及其实现技术   总被引:43,自引:4,他引:39  
网格 GIS是实现广域网络环境中空间信息共享和协同服务的分布式 GIS软件平台和技术体系。将地理上分布、系统异构的各种计算机、空间数据服务器、大型检索存储系统、地理信息系统、虚拟现实系统等 ,通过高速互连网络连接并集成起来 ,形成对用户透明的虚拟的空间信息资源的超级处理环境就是网格地理信息系统。本文在分析网络空间数据特征的基础上 ,提出了网格 GIS的 5层体系结构模型,分析了空间(元)数据标准、空间服务标准、分布空间对象技术、构件与构件库技术、基于框架的互操作技术、中间件技术等 ,它们是实现该系统的关键技术。  相似文献   

20.
基于VC环境的ComGIS基本功能之实现   总被引:3,自引:0,他引:3  
组件式地理信息系统(ComGIS)是指由一组遵循组件对象模型“工业标准”的、基于组件对象平台的、允许跨语言应用甚至跨计算机交互的组件提供的GIS,各GIS组件之间可通过标准的通信接口实现互操作,目前它已经成为地理信息系统软件发展的新潮流。Visual C++简称VC,是微软公司推出的一个面向对象的、功能丰富的可视化重量级的开发工具。在目前流行的VisualC,Visual Basic,Delphi等众多开发工具中,其功能最为强大。但目前对于在VC环境下如何开发组件式地理信息系统的研究却很少。本文以VC6.0开发环境和MapObjects2.0为例,采用西北干旱区典型的石羊河流域的数据,探讨了在VC环境中地理信息系统组件的嵌入、地理信息系统基本功能如图形的放大、漫游以及图形显示的恢复等基本问题,进而为开发基于VC环境的组件式地理信息系统提供参考和依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号