首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
中文地名地址具有构成复杂、语义多样、标准化困难等特征,随着地理信息共享平台及地名地址库建设,地名地址服务成为提升地理空间信息粘着力的核心接口。本文探讨了引入正则表达式改进了传统地名地址匹配算法流程的可行性,并基于WCF完成地名地址Rest服务开发,满足了哈尔滨市地理信息共享平台应用要求。  相似文献   

2.
刘现印  李玉琳  尹斌  田沁 《测绘科学》2021,46(8):165-171,212
中文地址解析是中文地址匹配最核心的问题.针对当前比较流行的基于条件随机场(CRF)或者基于规则的中文地址解析方法,该文结合深度学习中的双向门控循环网络(BiGRU)和CRF的方法来实现中文地址分词;并且针对当前的层次地址模型和四词位标注体系,该文采用 了基于空间关系地址模型和五词位的标注方法.然后分别采用基于规则的模型、CRF、BiGRU+SoftMax和BiGRU+CRF模型进行对比实验,发现该文提出的BiGRU+CRF模型配上新的空间关系地址模型及标注体系,可以对地址解析方面有更好的效果.  相似文献   

3.
提出了一种基于百度地图服务的地址解析方法,通过自动搜索和调用百度数据资源,实现了地名地址信息的快速、批量定位与上图,在武汉市第一次地理国情普查数据采集中取得了较好应用。  相似文献   

4.
以Oracle数据库为基础,分析地名地址检索的主要功能和关键技术。结果表明利用Oracle数据库语义分析功能,结合自定义分词词典库可以提高地名地址检索用户交互体验效果,为建设地名地址服务提供借鉴意义。  相似文献   

5.
现有重庆市地址模型存在地址不完整、歧义、口语化等弊端。以南岸为例,针对现有数据特点,围绕地址数据库建设及地理编码的需求,归纳非结构化中文地址的特点,优化现有地址要素结构。提出了基于中文语义的地址模型构建方法,建立要素间拓扑关系,增加上下文约束力,引入支持向量机,有效避免中文自然语言表达歧义,提高地址解析的准确度和效率。  相似文献   

6.
针对网页文本蕴含着丰富的地名地址空间信息,但因其描述的随机性、多样性,导致信息很难被快速、准确地识别出来的问题。该文在分析网页文本中地名地址组成特点的基础上,考虑地名地址的事件属性,提出了一种基于"地名地址基因"的信息提取方法,依据事件相关度、地名地址的字符长度等提取因子建立提取规则树获取目标地名地址。实际数据测试表明该方法在地名地址提取上更具针对性,提高了效率和准确率。  相似文献   

7.
在数字城市信息资源的集成和融合中,地名地址匹配是一项非常关键的基础技术。由于中文语义和地名地址描述的复杂性,中文地址的匹配比英文要复杂得多,基于海量中文地址数据进行准确分词,实现快速高效的地址匹配是城市数据集成融合的关键问题。本文在对现有地址编码及分词技术研究的基础上,通过一种基于规则和统计的组合方法来实现中文地址分词,并且使用K叉树的结构实现对中文地址的存储,提高了中文地址匹配查询的准确度和效率。基于预处理后的10 000个深圳市地址数据,通过开发原型系统对该方法进行了比较测试,验证了该方法的有效性。  相似文献   

8.
讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。  相似文献   

9.
宋子辉 《遥感学报》2013,17(4):788-801
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。  相似文献   

10.
针对智慧城市建设中各种业务数据对地名地址匹配准确度和效率不高的问题,本文提出一种面向智慧城市的高精度地名地址匹配方法。该方法在基于中文分词的地名地址匹配技术框架下,综合利用精细化地名地址库构建、地名地址特征分词库构建和基于用户搜索行为大数据分析3种关键技术提高地址匹配度和匹配精度。利用该方法对智慧德清建设项目中工商法人6 537条数据和130 988条精细化地址样本数据进行实验与分析。实验结果表明,在智慧城市大数据环境下,相比于传统地名地址匹配方法,该方法匹配精度高,效率也大大提升,同时在匹配度与精确度两个指标上匹配结果更加均衡。  相似文献   

11.
地名与地址之比较   总被引:1,自引:0,他引:1  
在对地名和地址定义分析基础上,从语义构成、存在的先后顺序、空间形态、指代空间范围的确定性、时间形态、文化内涵几个方面对二者进行了对比。研究表明:地址是一种复合的地名或地名的延伸;地名在先,地址在后;地名一般表示较模糊的面状范围,地址一般表示较具体的定位点;地名有历史、现状和规划三种时间形态,地址只有现状地址才有意义;地名具有文化内涵,地址是地名的组合,侧重于应用。  相似文献   

12.
"一村一镇一地图"是完成数字县(区)地理空间框架建设重要工作之一,在现代地理空间技术的协作下,开展地址地名外业的核查、增补工作是保证地名地址数据成果质量的关键。通过总结与分析郁南县地址地名外业调查工作底图制作、地名资料收集、技术路线、技术方法、调查区域划分、调查路线规划、外业成果整理等,为建设地址地名数据库提供基础。  相似文献   

13.
针对目前我国阿拉伯语地名的机器翻译研究空白,该文通过分析阿拉伯语地名的词法结构以及语音特点,提出了一种关于阿拉伯语地名的机器翻译方法:首先基于点互信息计算公式训练大量地名语料提取常用词;接着通过有向无环图数据结构提取地名模板;然后基于模板匹配解析待译地名词法结构,利用基于音节划分的音译模型音译词法结构中的专名;最后组合输出翻译结果。经过对阿语地名翻译实验,验证了本专用阿拉伯语地名机器翻译方法的有效性,对我国全球地理信息资源建设具有重要的现实意义。  相似文献   

14.
刘洋  赵婷婷  朱峰 《北京测绘》2020,(3):371-375
随着数字化的发展,越来越多的应用要求通过采用自然语言文字描述直接找到对应的详细的地址信息,并能够在空间位置上进行显示,即地名地址匹配空间化过程。然而,现今在地名的规范化角度还存在着很多问题,在乡镇或街道办及以上的行政等级的命名中都已基本规范统一,但是在村庄级的命名中还有待进一步的完善。所以本文通过对国内外文献研究,规范村名命名规律,匹配算法研究进一步加深中文村名俗称与规范名称的匹配算法的研究。  相似文献   

15.
许凯  张倩倩  王彦华  刘福江  秦昆 《测绘学报》2017,46(8):1017-1025
提出了一种基于概率潜在语义分析的多源遥感影像湿地检测方法。首先提取高分辨率影像的光谱、纹理和湿地场景的地物组成成分,并结合由多光谱遥感数据提取的湿地地表温度、土壤含水量,组成湿地场景的特征空间;然后利用概率潜在语义分析将湿地场景表示成多个潜在语义的组合,并用潜在语义的权值向量来描述湿地场景的特征空间;最后利用SVM分类器实现湿地场景的检测。试验表明,概率潜在语义分析能够将湿地的高维特征空间映射到低维的潜在语义空间中,地物组成成分和定量环境特征的加入能更加有效地表征湿地特征空间,提高湿地检测精度。  相似文献   

16.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

17.
地名地址是实现跨部门业务协同和实现数据共享的关键纽带,本文通过分析各部门地名地址数据情况,提出数据库设计优化方案,运用自然语言处理等技术,研究并实现了一种多源地名地址数据治理技术方案,构建了标准统一、要素丰富、空间精准的地名地址库。  相似文献   

18.
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的F1值。所提出的方法在泛化能力测试集上的F1值达到了0.940,在普通测试集上的F1值达到了0.968。  相似文献   

19.
地理编码是实现带有地址描述的信息空间定位的重要途径。比较研究了国内外地理编码方法,分析了中文地址的组成方式和定位方法。针对中文地址高度复杂性和多样性的特征,设计了一种顾及多种语义的地址匹配算法,并以武汉市新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病人入院时登记的地址描述信息为例,对匹配算法进行了实验验证,将匹配结果进行空间定位。结果表明,所提出的中文分词的加权地理编码方法匹配高效、定位准确、方法智能,能够实现基于语义的COVID-19病人入院时登记地址的快速定位,可为疫情防控提供准确的空间定位信息。  相似文献   

20.
地名地址数据是地理信息定位与交换的载体,是地理空间框架中的必要组成部分.本文基于Versant面向对象数据库,对地名地址的结构进行了分析及分类挂接到地址树中,设计了以现有关系数据库为基础,将地名地址数据导入到面向对象数据库的流程;同时,在Versant数据库中,设计了分布式存储过程,并进行了存储测试.结果表明,基于Versant数据库能够优化现有地址的存储,方便解决现有各种业务系统在地名地址数据使用中遇到的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号