首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

2.
中文地名识别是命名实体识别的重要研究课题之一,也是扩展地理信息系统数据来源的关键。传统的地名识别主要基于地名元素或词性特征进行识别,特征来源单一。针对上述问题,提出了一种顾及句法特征的中文地名识别方法,挖掘中文地名在自然语言中的句法信息,设计了短语结构和依存关系两类句法特征,利用条件随机场模型实现了中文地名的训练和识别。实验表明,句法特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

3.
中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

4.
彭认灿  袁银翔 《地图》1993,(4):21-24
本文介绍了如何利用微机实现中文地名索引自动编排的思路和方法,并给出了试验结果。可以预见,这一软件系统的建立将结束中文地名索引人工编排的历史,大大减轻地图制图工作者的劳动强度,提高我国地图集的制作效率。  相似文献   

5.
讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。  相似文献   

6.
归类识别地名匹配算法   总被引:1,自引:0,他引:1  
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

7.
<正> 地名就是地名——一个特定的、有明确范围的空间的名称,它的主要功能就是一个地方或一个地域范围的代表或识别标志,因而应该尽可能保持稳定。这本来是一种常识,也是地名使用的惯例,近年  相似文献   

8.
地名是最常用的社会公共信息之一,是不可或缺的基础地理信息资源。探讨基于VGI的地名信息获取方法,设计基于Neogeography模式的中文地名词典服务系统架构,讨论地名词典服务的协议标准,实现服务端和客户端的基本功能,提出地名评估校验的基本策略。  相似文献   

9.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

10.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

11.
针对网络数据源的分类标准与我国分类标准不同且相互独立这一情况,该文提出了一种顾及权重的地图中地名自动分组标注算法:依据图层要素的类别属性在知识库中查找最符合的权重知识,将地物标注分组;对权重最高的组进行标注叠加分析、最优化分析,进而达到最优化标注;将最优化的标注与次级权重高的组进行叠加分析、最优化分析,进而达到次级组的最优化标注;循环此步骤,直到末级组的最优化标注。依据此方法能够自动实现对集成数据中同一层具有不同权重地物的差别化标注,最后结合中国地名分类代码和OSM分类代码实现了该算法。  相似文献   

12.
针对网页文本蕴含着丰富的地名地址空间信息,但因其描述的随机性、多样性,导致信息很难被快速、准确地识别出来的问题。该文在分析网页文本中地名地址组成特点的基础上,考虑地名地址的事件属性,提出了一种基于"地名地址基因"的信息提取方法,依据事件相关度、地名地址的字符长度等提取因子建立提取规则树获取目标地名地址。实际数据测试表明该方法在地名地址提取上更具针对性,提高了效率和准确率。  相似文献   

13.
获取光伏电池板的空间分布及动态变化信息对于国土调查、资源环境监测和能源结构评估具有重要意义,然而,传统的光伏电池板的识别依赖于人工设计的中低层次特征,无法克服对象光谱不确定性、空间结构类型复杂等难题,算法普遍存在稳健性不强、效率不高等问题。目前,基于场景单元从遥感影像中提取空间信息,多数算法仅建立在少数标准数据集上,未考虑实际应用中遥感图像质量、空间分辨率等因素对图像场景深度特征表达的影响,制约了遥感技术在城市结构、经济社会知识挖掘方面的深入应用。针对以上情况,本文基于卷积神经网络(CNN)采用迁移学习和模型微调的策略,在中等分辨率的Landsat影像上进行光伏电池板场景识别。结果表明,本文方法能够提取电站场景的多层次特征,在形态结构复杂的电站场景中取得了较好的识别效果。  相似文献   

14.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1000000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。  相似文献   

15.
点状地图符号的神经网络识别   总被引:1,自引:1,他引:1  
基于神经网络的点状地图符号自动识别研究,设计了点状符号识别流程。采用四层BP网络模型,通过参数设置及输入输出设计优化网络,通过数据格式分析及内存调整优化程序,在程序实现过程中反复试验,总结出了参数的变化规律,实现了点状符号的简单、快速识别。  相似文献   

16.
This paper presents a method of adding label to the map especially for the point feature. This method overcomes the shortcoming of traditional methods, e.g.Conflict-Backtracking method. Its kernel algorithm use the hopfield neural network to find the best label position for point feature. The experimental resuits proves that this algorithm has good permanence and high speed.  相似文献   

17.
This paper presents a method of adding label to the map especially for the point feature. This method overcomes the shortcoming of traditional methods, e.g. Conflict-Backtracking method. Its kernel algorithm use the hopfield neural network to find the best label position for point feature. The experimental results proves that this algorithm has good permanence and high speed.  相似文献   

18.
Ma  Kai  Tan  YongJian  Xie  Zhong  Qiu  Qinjun  Chen  Siqiong 《Journal of Geographical Systems》2022,24(2):143-169
Journal of Geographical Systems - Many natural language tasks related to geographic information retrieval (GIR) require toponym recognition, and identifying Chinese toponyms from social media...  相似文献   

19.
针对地理空间数据交换和共享平台的地名数据日益增多及不同部门的数据差异所造成的地名检索效率低下问题,该文分析了平台中地名的表达特征,设计了面向地名信息的多级索引库组织方式,提出了地名特征词典的构建方法,设计并开发原型系统,实现了基于Lucene和地名特征词的检索框架。实验表明:多级索引通过基础索引、特征索引、分类索引三者联动的方式降低了地名检索的复杂度,具有较高的检索效率和准确度,应用于浙江省地理空间数据交换和共享平台取得了良好的效果。  相似文献   

20.
GPS坐标转换方法对于GPS空间定位系统至关重要。目前已有很多方法被提出用于转换GPS坐标,但效果并不是很显著。究其原因,是因为大多数都存在模型误差和投影误差。针对目前方法的不足,本文利用深度学习对非结构化数据处理的优势,提出了一种基于卷积神经网络(CNN)的GPS坐标转换方法。该方法将GPS数据转化为非结构化图片数据,以其作为CNN的输入层来训练GPS坐标转换模型,这样能够最小化满足对数据的预处理要求,无监督地从数据中学习出有效特征。试验结果表明,该方法与传统坐标转换方法相比,具有更高的转换精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号