首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对智慧城市建设中各种业务数据对地名地址匹配准确度和效率不高的问题,本文提出一种面向智慧城市的高精度地名地址匹配方法。该方法在基于中文分词的地名地址匹配技术框架下,综合利用精细化地名地址库构建、地名地址特征分词库构建和基于用户搜索行为大数据分析3种关键技术提高地址匹配度和匹配精度。利用该方法对智慧德清建设项目中工商法人6 537条数据和130 988条精细化地址样本数据进行实验与分析。实验结果表明,在智慧城市大数据环境下,相比于传统地名地址匹配方法,该方法匹配精度高,效率也大大提升,同时在匹配度与精确度两个指标上匹配结果更加均衡。  相似文献   

2.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

3.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

4.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

5.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

6.
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

7.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

8.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

9.
针对计算机进行GIS中文地址匹配困难的问题,提出了以词库为基础,采用中文分词算法和全文检索技术,确定中文语句和目标的相似性,并设计具体的推理方法,最终实现地名匹配并在地图上显示查询信息。  相似文献   

10.
地名地址匹配引擎是连接地理信息与其他数据的桥梁,在智慧城市建设中发挥着至关重要的作用,但已有的地名地址数据库已经无法与当前城乡建设快速发展的实际情况相适应.为解决地名地址信息变化快、数量多但地名地址信息采集更新滞后的问题,本文基于有限地名地址信息,设计了以层级地址模型为基础的地名地址匹配算法,优先针对已有的标准地址进行精准匹配,对地名地址库中缺失的地址或非标准地址参照已有标准地址进行插值计算,实现了基于有限信息的地名地址匹配,提升了数据匹配精度,为智慧城市时空大数据平台提供了高效可靠的地名地址引擎解决方案.  相似文献   

11.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

12.
政府部门在业务工作流程中产生了内容丰富的政务数据,需要对政务数据进行高效的空间化来满足共享与可视化展示需求。结合政务数据共享与交换现状,挖掘政务数据的特征,分析地名地址的结构化内容,提出了基于位置准确、覆盖面广的地名与地址空间化方法基本流程。流程包括对政务数据进行地址信息提取分析和拆分、规范性预处理、地址分词、地址匹配,最终使政务数据具有空间坐标,实现由文本格式到电子地图的展示。该方法已在"数字常州"规上企业等政务数据空间化中得到了应用。  相似文献   

13.
针对GIS地名搜索系统的关键技术,阐述了用于分词搜索的词典设计,设计了中文分词算法;选用全文检索引擎Lucene实现了地址匹配组件;设计了地名搜索系统架构并实现了地名搜索功能。  相似文献   

14.
地理编码系统中地名地址分词算法研究   总被引:4,自引:0,他引:4  
张林曼  吴升 《测绘科学》2010,35(2):46-48
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。  相似文献   

15.
地名地址数据库属于基础地理信息数据库,是构成数字城市地理空间框架不可或缺的重要组成部分,随着我国数字城市的逐步推进,城市建设和管理工作对基础地理信息的需求日益增加,地名地址数据库的建设和更新工作显得尤为重要。面对当前城市发展日新月异的现状,如何有效地提升数据完整性、时效性以及权威性成为数据库更新工作中必须解决的问题。本文以德州市地名地址数据库更新项目为例,指出外业调查中存在的数据问题,在对多来源地名地址数据进行广泛收集,分析这些数据的空间特征、时间特征以及利用方式的基础上,提出基于多源数据集成的数据库建设思路,利用地名地址匹配技术及人机交互的方式将官方资料与调查数据进行有机融合,并详细地从数据体系化检核、地名地址拓展、名称标准化3个方面进行阐述。项目成果表明,数据的质量明显提升。  相似文献   

16.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

17.
魏金明  仲伟政 《测绘科学》2015,40(1):122-125
针对市域地址数据特点,文章在地址编码和地址匹配现有研究成果的基础上,参照济南市地址使用习惯,提出了一种基于置信度的地址匹配方法。该方法以地址数据库为基础,依托规范化地址编码,利用分词算法和置信度筛选的方法匹配数据,通过人机交互的方式扩充地址库,实现了地址的自动匹配定位,提高了匹配的正确性。  相似文献   

18.
前后缀与特征词相结合的地名地址提取   总被引:2,自引:0,他引:2  
随着地理信息与计算机技术的发展,网络中的非结构化地名地址数据越来越多,逐步成为地理信息更新的重要途径之一。针对互联网中地名地址的存在方式及结构特点,本文提出了一种前后缀与特征词相结合的地名地址识别提取方法。首先利用HMM训练进行分词,接着通过地名地址前后缀词库进行候选地名切分与预提取,最后根据特征词进行匹配过滤,实现对地名地址的准确提取。试验结果证明,本文方法提高了地名地址识别的准确率和召回率,很大程度上解决了未登录地址提取问题。  相似文献   

19.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

20.
林筝 《测绘通报》2016,(4):124-127
全景地图作为移动测量成果已经开始应用于空间数据更新。本文将全景地图与公开版地图数据库结合,进行了街道地名地址的数据采集,建立了标准地名地址库;通过建立地名规则库和地址匹配引擎,将非标准地名进行分词处理后与标准地名地址之间对应匹配,最后发布地名服务,实现了匹配结果的在线查询和定位。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号