首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

2.
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。  相似文献   

3.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

4.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

5.
孙立财  陈以松  熊杰  罗安  王勇 《测绘通报》2021,(10):108-113
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。  相似文献   

6.
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。  相似文献   

7.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

8.
地名地址数据是数字城市及智慧城市在建设和运营中不可或缺的基础数据之一,且地名地址数据的有效性、时效性与鲜活性,直接影响城市平台的运营与管理质量。本文主要探讨了当前地名地址数据更新的方法,分析了这些方法的优缺点及适用性;最后,论述地名地址数据更新方法的发展方向,以指导当前地名地址数据的更新工作。  相似文献   

9.
地名地址匹配引擎是连接地理信息与其他数据的桥梁,在智慧城市建设中发挥着至关重要的作用,但已有的地名地址数据库已经无法与当前城乡建设快速发展的实际情况相适应.为解决地名地址信息变化快、数量多但地名地址信息采集更新滞后的问题,本文基于有限地名地址信息,设计了以层级地址模型为基础的地名地址匹配算法,优先针对已有的标准地址进行精准匹配,对地名地址库中缺失的地址或非标准地址参照已有标准地址进行插值计算,实现了基于有限信息的地名地址匹配,提升了数据匹配精度,为智慧城市时空大数据平台提供了高效可靠的地名地址引擎解决方案.  相似文献   

10.
王勇  刘纪平  郭庆胜  罗安 《测绘学报》2016,45(5):623-630
针对互联网POI(兴趣点)地址信息中广泛存在的地址要素不完整、文字表达不一致等不规范现象,提出一种顾及位置关系的网络POI地址信息标准化处理方法,首先对POI信息进行切分提取并逐层匹配地址树模型;然后基于4种位置关系从标准POI库中选出相应集合,作为丰富和修正非标准POI地址要素的候选;最后通过最小粒度地址要素的回溯,实现POI地址信息的快速标准化处理。试验表明该方法可以获得较高的准确率,尤其适用于在互联网数据环境中的POI地址信息标准化。  相似文献   

11.
"四标四实"是由广州市委市政府提出的对于深化平安有序规范城市管理专项行动的核心工作.其中"四标"包含标准地址库,它是空间位置的结构化描述,建立统一的标准地址库可为城市的社会治理和智慧城市建设奠定基础,本文通过对广州市增城区地址库现状分析,提出采用自主研发的"众采"移动GIS平台的采集地址数据方法,阐述了标准地址数据库建设情况,并以实例说明标准数据库的建设成效.  相似文献   

12.
地址数据标准化是标准地址库建设的重要环节。本文研究了地址数据标准化的数据转换、要素分级、地址编码等关键技术及其基于FME的技术实现,并将其应用于标准地址库建设,实现了海量地址数据的批量标准化处理。  相似文献   

13.
地名地址是实现跨部门业务协同和实现数据共享的关键纽带,本文通过分析各部门地名地址数据情况,提出数据库设计优化方案,运用自然语言处理等技术,研究并实现了一种多源地名地址数据治理技术方案,构建了标准统一、要素丰富、空间精准的地名地址库。  相似文献   

14.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

15.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义.  相似文献   

16.
针对智慧城市建设中各种业务数据对地名地址匹配准确度和效率不高的问题,本文提出一种面向智慧城市的高精度地名地址匹配方法。该方法在基于中文分词的地名地址匹配技术框架下,综合利用精细化地名地址库构建、地名地址特征分词库构建和基于用户搜索行为大数据分析3种关键技术提高地址匹配度和匹配精度。利用该方法对智慧德清建设项目中工商法人6 537条数据和130 988条精细化地址样本数据进行实验与分析。实验结果表明,在智慧城市大数据环境下,相比于传统地名地址匹配方法,该方法匹配精度高,效率也大大提升,同时在匹配度与精确度两个指标上匹配结果更加均衡。  相似文献   

17.
地名地址数据库属于基础地理信息数据库,是构成数字城市地理空间框架不可或缺的重要组成部分,随着我国数字城市的逐步推进,城市建设和管理工作对基础地理信息的需求日益增加,地名地址数据库的建设和更新工作显得尤为重要。面对当前城市发展日新月异的现状,如何有效地提升数据完整性、时效性以及权威性成为数据库更新工作中必须解决的问题。本文以德州市地名地址数据库更新项目为例,指出外业调查中存在的数据问题,在对多来源地名地址数据进行广泛收集,分析这些数据的空间特征、时间特征以及利用方式的基础上,提出基于多源数据集成的数据库建设思路,利用地名地址匹配技术及人机交互的方式将官方资料与调查数据进行有机融合,并详细地从数据体系化检核、地名地址拓展、名称标准化3个方面进行阐述。项目成果表明,数据的质量明显提升。  相似文献   

18.
地址树模型的中文地址提取方法   总被引:1,自引:0,他引:1  
地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。  相似文献   

19.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

20.
地理编码数据库是地理编码技术的重要组成部分,它直接影响到地址匹配的效果。本文在青岛市地址体系的分析研究的基础上,详细阐述了青岛市地理编码数据库的建设流程,包括地址数据获取、地址数据标准化、地址数据入库和地址数据库组织的建设,并对地址数据的更新提出了建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号