首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 110 毫秒
1.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。  相似文献   

2.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

3.
毛曦  颜闻  马维军  殷红梅 《测绘科学》2019,44(6):296-300,316
针对现有无法区分地名专名与通名而导致的地名机器翻译准确率低与可用性差等问题,该文提出了基于自然语言注意力机制的地名机器翻译技术。深度学习模型中注意力机制是对于人类认知的模拟。该文通过对于大规模平行语料的训练,针对地名的自然语言特征,建立了地名语言环境约束条件下的注意力机制模型,并将其用于地名翻译过程中的专名与通名区分,从而提高整体的地名翻译精度。经过地名翻译实验,证明了该机器翻译技术比传统方法具有更高的准确率,有助于提高全球地理信息资源建设中地名产品的自动化水平。  相似文献   

4.
现有外语地名机器翻译中只有关于音译方面的研究,区分地名通名与专名的研究未开展,造成无法区分地名的通名与专名,外语地名翻译过程中无法正确选择音译与意译的翻译方式,外语地名翻译准确率不高.针对这一问题,提出一种外语地名通专名区分技术.该技术通过对地名词语构建结构树,并对树的叶子节点进行分类来完成通名与专名的区分,从而确定翻...  相似文献   

5.
地名信息是基础地理信息的不可或缺的要素,是空间信息的重要载体,地名信息化建设是实现数字地球的基础和前提.文章通过考察地名的语言学、地理学、历史学特征,明确了地名的基本内涵.以此为基础建立地名本体基本框架,并以地名类型为例,分析了地名类型本体的基本语义关系及其表达方法;最后以地名本体为基础提出地名信息描述框架,并以实例说明了基于本体的地名信息描述方法,该方法为地名知识库的建立及应用提供了参考.  相似文献   

6.
地名凝结了区域文化及历史过程,蕴涵丰富的文化信息。如何挖掘地名文化信息是一个有趣又重要的问题。结合文本知识、专业知识、先验知识、专家知识与第二次全国地名普查成果数据,通过建立知识库及提取规则,采用数据制图、模型制图、知识制图等制图方法实现中国大陆方言地名、地名通名制图。结果表明,制图结果可以得到相关地名的空间分布范围,揭示区域地名通名的高频词汇特征,可以为区域地名管理、规划、保护与利用提供知识支撑。  相似文献   

7.
地理编码系统中地名地址分词算法研究   总被引:4,自引:0,他引:4  
张林曼  吴升 《测绘科学》2010,35(2):46-48
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。  相似文献   

8.
关于小比例尺地图上我国地名罗马化的几点设想   总被引:1,自引:0,他引:1  
曾世英 《地图》1993,(1):8-13
我国地名的罗马化长期存在分歧混乱。《汉语拼音方案》法定后椐以拼写的我国地名,经联合国地名会议通过,已成为中国地名的国际标准。在小比例尺地图上,为了图面清晰,如何处理地名的拼写,本文提出四点建议。 (1)现行汉字版小比例尺地图上,对专名为双音节或多音节的县名的通名县字往往脱落,而当专名为单音节时,通名保留并和专名联写。这在体例上似乎存在矛盾,其实是符合现代汉语习惯的。(2)少数民族自治县行政单位驻地名称大都用一长串汉字称说。现在汉字版地图上有的标全称,有的标简称。在罗马化时以采用简称为宜。(3)台湾方面地名的音译沿用威妥玛式。台湾已于1984年制订了《国语注音符号》第二式,并于1986年公告正式使用。如果它也适用于地名的罗马化,在一国两制的前提下,我们今后出版的地图上也宜采用。(4)现行的地名罗马化的地图集中,对多音节县名只标专名,不见通名,但其所附的地名索引中则专名和通名并列,并分写。而对单音节县名,在图面上专名和通名并列并联写。但在索引中则分写,形成图面和索引的矛盾。国际电信联盟对我国的多音节县名略去通名,对单音节县名则专名和通名并列,并联写。这正和图面相同,有利于地名标准的推广。此外,本文还列举大量统计,说明单音节县名是古代遗留下来的,不合现代汉语习惯。这对今后我国地名的标准化也有深远的参考意义。  相似文献   

9.
随着湛江市地理信息服务平台的建立,其核心数据库需进一步进行完善。基于全要素基础地形图、影像数据、地质、规划、管线信息和基础地名数据,构建地名地址数据库,为湛江市地理信息服务平台电子地图提供基础地理信息框架信息。本文论述了地名地址模型构建、编码原则,数据库设计及更新,并介绍地名数据库的应用情况。  相似文献   

10.
徐华勇  徐凤怡  苏阳 《地理空间信息》2021,19(10):110-111,116
通过对《基础地理信息1:10000地形要素数据规范》及《国家基本比例尺地图图图式第2部分:1:50001:10000地形图图式》中地名注记的必要性,地名注记的分层、属性值的填写内容、地名与要素实体的几何关系及地名特性的研究,实现对地名要素的准确表达.  相似文献   

11.
点状地名信息的加权泰森多边形检索法   总被引:1,自引:0,他引:1  
张宇  王琦  吴文周  苏奋振 《测绘学报》2017,46(11):1919-1926
鉴于地名库中多数地名仅以中心点坐标形式记录其空间位置信息,缺乏其空间范围的具体描述,造成地名检索中的片面性和局限性,本文在深入分析地名及其空间属性、空间关系的基础上,考虑同类型地名的不同性质在检索中的重要作用,利用泰森多边形在地名边界近似中的优势,提出了针对点状地名信息的加权泰森多边形检索法,依据同类型地名的面积属性作为权重指标构建泰森多边形,以近似表达地名的空间范围,进而描述地名间的各类空间关系;并从拓扑关系、方位关系与距离关系3个方面给出了具体公式以计算地名间的空间相似性;最后以行政区划边界近似与检索为例验证该方法。试验结果表明,该方法可较好地近似表达地名空间范围及空间关系,增强了检索词与地理信息资源在空间位置上的相似性度量,检索结果优于传统方法。  相似文献   

12.
吴飞 《北京测绘》2021,35(2):178-182
地名是重要的地理信息和社会公共资源,与人们的生产生活息息相关,地名承载着国家和民族的历史、文化以及情感.为摸清地名家底,新中国成立以来在不同时期,我国开展了两次全国性地名普查工作.本文简要介绍了地名和测绘的渊源,阐述了跨越30年的北京市两次地名普查的时代背景和要求.通过测绘技术在两次地名普查实施中的应用,折射出30年来...  相似文献   

13.
大数据时代地理空间资源不断增多,但现有通用知识库较少考虑地理空间数据蕴含的语义知识,难以实现数据的快速检索.因此亟需引入本体技术,以蕴含的语义知识为基础,提高地理空间数据访问速度,精确获取用户所需信息.以本体为基础,提出了顾及地理空间数据语义知识的快速检索方法.首先,基于通名编码规则、地理空间数据和开源百度百科数据构建...  相似文献   

14.
陈优良  朱倩 《测绘科学》2021,46(2):178-185
针对目前地名文化中客家聚落地名研究的不足,该文从客家迁徙历史的角度,提出了客家地名定性和定量的研究方法,以客家摇篮石城地名为研究对象,采用核密度分析法和多元logit回归模型方法,深入分析石城客家地名的时空分布特征和历史演变因素。结果显示:在时间上,客家地名数量整体呈现上升趋势,增长时间分为5个阶段,隋唐萌芽时期、宋朝大量增长期、元朝缓慢增长期、明朝平稳增长期和清朝快速增长期;在空间上,客家地名分布显现出聚集特征,但聚集程度各异,聚集点和聚集区域随着时间的推移而变化。根据logit模型结果显示,地形、河流、人口和经济等多种因素交融在一起,对客家地名的演化产生了重大而深远的影响。  相似文献   

15.
张冲  刘永轩 《北京测绘》2020,(4):462-466
为实现第二次全国地名普查成果转化目的,利用普查成果数据,基于WebGIS、大数据、云平台等技术方法,开发了北京市区划地名信息社会服务系统。介绍了系统建设背景及其必要性,详细阐述了系统设计方案、总体架构及其关键技术,深入挖掘地名特色和文化内涵,以讲地名故事、检索地名信息及空间位置、统计地名图表等多种形式,满足社会公众获取权威地名信息的需求。本文以北京市区划地名信息社会服务系统建设为主线,实现全方位、多角度的展示北京市地名普查成果。  相似文献   

16.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

17.
针对大量英文地名急需实现中文翻译及目前英语地名自动翻译研究较少、翻译结果质量低下的问题,该文提出了一种英语地名机器翻译方法。首先对于不同类别地名语料基于点互信息和有向无环图数据结构提取地名模板,然后基于统计模板模型解析地名词法结构实现翻译。实验结果表明:该方法翻译精度相对较高,可有效应用于地名生产。本方法解决了地名翻译中通专名合理区分的难题,同时利用地名类别属性辅助翻译,大大节省了人工成本,对我国地名翻译及生产领域具有一定参考意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号