共查询到20条相似文献,搜索用时 859 毫秒
1.
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。 相似文献
2.
3.
4.
5.
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 相似文献
6.
《测绘科学技术学报》2013,(5)
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。 相似文献
7.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 相似文献
8.
张志文 《测绘与空间地理信息》2016,(4):192-193
地名地址数据是数字城市及智慧城市在建设和运营中不可或缺的基础数据之一,且地名地址数据的有效性、时效性与鲜活性,直接影响城市平台的运营与管理质量。本文主要探讨了当前地名地址数据更新的方法,分析了这些方法的优缺点及适用性;最后,论述地名地址数据更新方法的发展方向,以指导当前地名地址数据的更新工作。 相似文献
9.
地名地址匹配引擎是连接地理信息与其他数据的桥梁,在智慧城市建设中发挥着至关重要的作用,但已有的地名地址数据库已经无法与当前城乡建设快速发展的实际情况相适应.为解决地名地址信息变化快、数量多但地名地址信息采集更新滞后的问题,本文基于有限地名地址信息,设计了以层级地址模型为基础的地名地址匹配算法,优先针对已有的标准地址进行精准匹配,对地名地址库中缺失的地址或非标准地址参照已有标准地址进行插值计算,实现了基于有限信息的地名地址匹配,提升了数据匹配精度,为智慧城市时空大数据平台提供了高效可靠的地名地址引擎解决方案. 相似文献
10.
11.
12.
余远剑 《测绘与空间地理信息》2017,40(11)
地址数据标准化是标准地址库建设的重要环节。本文研究了地址数据标准化的数据转换、要素分级、地址编码等关键技术及其基于FME的技术实现,并将其应用于标准地址库建设,实现了海量地址数据的批量标准化处理。 相似文献
13.
地名地址是实现跨部门业务协同和实现数据共享的关键纽带,本文通过分析各部门地名地址数据情况,提出数据库设计优化方案,运用自然语言处理等技术,研究并实现了一种多源地名地址数据治理技术方案,构建了标准统一、要素丰富、空间精准的地名地址库。 相似文献
14.
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景. 相似文献
15.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义. 相似文献
16.
针对智慧城市建设中各种业务数据对地名地址匹配准确度和效率不高的问题,本文提出一种面向智慧城市的高精度地名地址匹配方法。该方法在基于中文分词的地名地址匹配技术框架下,综合利用精细化地名地址库构建、地名地址特征分词库构建和基于用户搜索行为大数据分析3种关键技术提高地址匹配度和匹配精度。利用该方法对智慧德清建设项目中工商法人6 537条数据和130 988条精细化地址样本数据进行实验与分析。实验结果表明,在智慧城市大数据环境下,相比于传统地名地址匹配方法,该方法匹配精度高,效率也大大提升,同时在匹配度与精确度两个指标上匹配结果更加均衡。 相似文献
17.
地名地址数据库属于基础地理信息数据库,是构成数字城市地理空间框架不可或缺的重要组成部分,随着我国数字城市的逐步推进,城市建设和管理工作对基础地理信息的需求日益增加,地名地址数据库的建设和更新工作显得尤为重要。面对当前城市发展日新月异的现状,如何有效地提升数据完整性、时效性以及权威性成为数据库更新工作中必须解决的问题。本文以德州市地名地址数据库更新项目为例,指出外业调查中存在的数据问题,在对多来源地名地址数据进行广泛收集,分析这些数据的空间特征、时间特征以及利用方式的基础上,提出基于多源数据集成的数据库建设思路,利用地名地址匹配技术及人机交互的方式将官方资料与调查数据进行有机融合,并详细地从数据体系化检核、地名地址拓展、名称标准化3个方面进行阐述。项目成果表明,数据的质量明显提升。 相似文献
18.
19.
20.
地理编码数据库是地理编码技术的重要组成部分,它直接影响到地址匹配的效果。本文在青岛市地址体系的分析研究的基础上,详细阐述了青岛市地理编码数据库的建设流程,包括地址数据获取、地址数据标准化、地址数据入库和地址数据库组织的建设,并对地址数据的更新提出了建议。 相似文献