首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

2.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

3.
朱鹏  石丽红  焦明连  刘晓东  孙浩 《测绘科学》2021,46(11):159-165
针对互联网媒体数据中地名信息表达不规范、实体边界不清晰、地名简化表达问题,该文提出了一种混合神经网络的中文地名识别方法.通过ALBERT层学习字级别特征表达与BiLSTM层提取文本上下文语义特征,由CRF层获得全局最优标记序列,更有效地识别并提取中文地名.数据测试表明:相较于BiLSTM的地名识别模型,本文模型精确率提高12.89%,F1值提高10.83%;相较于BiLSTM-CRF的地名识别模型,本文模型精确率提高3.56%,F1值提高2.1%;相较于ALBERT-CRF的地名识别模型,本文模型精确率提高1.22%,F1值提高0.72%.  相似文献   

4.
建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。  相似文献   

5.
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

6.
讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。  相似文献   

7.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

8.
地理编码系统中地名地址分词算法研究   总被引:4,自引:0,他引:4  
张林曼  吴升 《测绘科学》2010,35(2):46-48
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。  相似文献   

9.
利用地名语义实现Web地震事件空间信息提取   总被引:1,自引:0,他引:1  
针对Web新闻中地震事件地点要素提取的需求,提出了利用地名语义技术实现的地震事件空间信息提取的解决方案。通过构建地名本体库来支持标准化地名构建,通过句法分析、中文分词和词性标注识别地名,通过地名的标准化从地名本体库获得地名语义信息提取地震事件地点信息。同时,利用语义库及其推理机制完成地名标定范围内的地震事件搜索,成功地获取了中国境内近年的各省地市县的地震事件的空间分布情况。原型系统验证了论文方法的可行性和有效性。  相似文献   

10.
基于汉字模糊音的地名查询方法设计与实现   总被引:2,自引:1,他引:1  
目前,GIS地名查询一般都是以输入准确中文作为查询条件,但在实际应用中,有时用户说不清楚地名的准确中文;有时用户由于中文输入法操作不熟练而在中文输入上浪费了许多时问。针对这两个问题,提出了一种基于汉字模糊音的地名查询方法,即以汉字拼音首字母作为该汉字的模糊音,给定查询条件时以模糊音代替原来中文输入,实现地名查询。设计了实现该方法的两个可行方案,并作了分析比较。采用地名模糊音方案实现了该方法。该方法对于增强地名查询功能、提高地名查询效率具有一定的实际意义。  相似文献   

11.
Although it is well known that coseismic gravity changes take place during an earthquake, previous research has not yielded convincing evidence demonstrating that significant gravity changes occur before large earthquakes. Furthermore, even if we suspect that gravity changes occur before large earthquakes, we have yet to demonstrate how to consistently observe these changes for useful earthquake forecast that would bring benefits to society. We analyzed ground gravity survey data obtained in 1998, 2000, 200...  相似文献   

12.
3维技术以其直观、眩目的表现力深受人们喜爱.利用3S技术和Skyline开发平台,可以构建大型企业3维地理信息系统,以满足企业设计部门和资产管理部门对基础地理信息的需求.兼容原有2维系统的总图3维信息系统,将为企业的日常管理、设计施工、分析统计、规划决策等提供更加可靠、直观、多层次、多功能的综合服务信息.  相似文献   

13.
 采用Landsat TM数据分析了阿克苏河—塔里木河断面水质污染状况,通过波段的DN值和常规监测数据建立能反映水质状况的 污染物监测模型。结果发现,将2000年常规监测数据代入模型后,与遥感数据的结果基本吻合| 重建阿克苏河—塔里木河的连续水体 污染变化曲线,得出污染物浓度随着远离上游而增加。  相似文献   

14.
董群 《现代测绘》2009,32(4):16-19
数字高程模型和数字正射影像是城市基础地理信息的核心载体.两者数据都是连续的地表模型数据.本论文旨在研究建立一个以这两种数据为主体的数据库集成管理系统,并能够提供基本的分析和应用功能,为城市的规划、建设、管理和社会各行业提供完善、优质和高效的地理空间数据服务.论文以宁波市两者数据的建库为例.首先介绍一些有关背景资料;然后详细研究了该系统的设计情况,包括设计的原则、技术路线,数据组织和功能规划;最后进行总结,分析了该系统架构设计的优缺点.  相似文献   

15.
互联网时代的地理信息系统   总被引:136,自引:0,他引:136  
张犁  林晖  李斌 《测绘学报》1998,27(1):9-15
本文通过分析近年来信息技术和地理信息系统的进展,探讨在互联网时代的地理信息系统的发展趋势和技术,提出了以构件化的分布式地理信息系统的发展方向,并以新的概念探讨了以互联网为平台的GIS的构件模型和客户-服务器模型为基础的GIS服务模型。  相似文献   

16.
如何有效存储GML数据是当今GIS界研究的热门课题。本文首先分析了现有XML数据存储技术,并根据GML的特性,提出了GML数据存储策略以及实现技术。  相似文献   

17.
浅谈MapGIS到ArcGIS数据自动转换实现   总被引:3,自引:0,他引:3  
文本介绍了如何用编程方式实现MapGIS点、线、面数据及渲染(Render)样式到Arc—GIS的自动转换,并对关键技术、难点进行详细描述。  相似文献   

18.
Tikhonov正则化方法在GOCE重力场求解中的模拟研究   总被引:6,自引:4,他引:2  
本文在阐述Tikhonov正则化方法基本原理的基础上,给出了四类可用于重力场解算的正则化矩阵(零次、一次、二次和Kaula),以及用于确定正则化参数的L曲线法和GCV方法的数学模型。基于SA方法利用模拟数据分析讨论了零次、一次以及Kaula正则化矩阵应用于GOCE全球重力场模型确定的有效性,并由Kaula正则化矩阵分析了L曲线法和GCV方法确定正则化参数的可行性。数值结果表明三类正则化矩阵获得的最优解(以大地水准面MSE最小为准则确定)的精度水平相近,关键在于相应正则化参数的确定,数值结果同时说明了GCV方法和L曲线法可用于确定正则化参数,且前者较后者具有更好的稳定性。  相似文献   

19.
在日本和中国中东部地区,就日本准天顶卫星系统(QZSS)对GPS导航精度增强、完好性增强以及可用性增强进行了仿真计算比较。结果表明,只有3颗卫星组成的QZSS在这些区域内对GPS提供了有效的性能增强,而且随着卫星截止角的增加,这种性能增强显得更为明显;QZSS在战时可有效降低由于部分GPS卫星失效而导致的性能恶化程度。分析结果对于我国在中部地区和东部热点地区有效利用GNSS导航资源具有指导作用。  相似文献   

20.
我国地理信息系统建设及进展(1)   总被引:3,自引:0,他引:3  
GIS的基础背景和发展阶段与GIS业务化应用系统的建设两个部分,着重叙述了GIS建设的探索过程和发展思路,指出GIS建设从初步发展时期的研究实验、局部应用向着实用化、集成化和产业化方向发展,成为国民经济和社会发展普遍使用的工具,在各行各业发挥着重要的作用。同时用实例说明GIS业务化应用系统,在我国大体经历的四个发展阶段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号