首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

2.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。  相似文献   

3.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别.  相似文献   

4.
在线地理编码服务是非专业用户最常用的非空间数据空间化的手段。然而,大量在线地理编码服务的出现增加了用户选择的困难,因此通过对主流的在线地理编码服务质量进行评价,为公众的日常应用提供选择上的指导,并有助于在线地理编码服务商发现服务存在的缺陷,进一步完善服务。基于国内主流的4种在线地理编码服务——百度、高德、搜狗和腾讯,采用与衣食住行相关的4类地址作为检验数据,分别从地址匹配率、地理编码服务位置精度和一致性三个方面,对4种服务进行质量评价,得到以下结论:造成4种服务质量差异的主要原因是其参考库的质量差异;高德地图有最高的地址匹配率和最差的位置精度;腾讯地图整体表现较为优异,具有较高的数据质量和较完备的地址数据。  相似文献   

5.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

6.
地理编码系统中地址匹配引擎的设计与实现   总被引:8,自引:0,他引:8  
分析了地址匹配流程和几种模糊检索技术,选用了全文检索引擎包Lucene设计了地址匹配引擎,实现了基于XML Web Services的地理编码系统。  相似文献   

7.
地址文本作为描述地理位置的字符串,通过对文本信息的解析可将自然地址描述转化为可被计算机识别的地理空间位置。通过分析地籍数据中地址文本的特点,设计了基于词典匹配算法的地址逐级标准化算法,并开发了相应的原型系统。实验结果的准确率高于95%,且有较高的操作效率,具有一定的地址文本解析价值。  相似文献   

8.
国外地址数据标准分析及启示   总被引:1,自引:0,他引:1  
汇集和分析了地址数据标准化在国外的发展现状。结合美国目前地址标准化的进展,分析了美国邮政及民政部门的地址编码技术特点,介绍了地址数据标准化的需求及其在空间信息整合方面的作用。讨论了地址数据标准化的内涵、方法和一些热点问题。  相似文献   

9.
针对"数字湖北"地理空间框架建设,探讨了适合于湖北省省情的中文地理编码技术,将湖北省现有的地址实体进行空间化、规范化,建立标准化的地址数据库,并实现了湖北省中文地理编码服务共享。以标准地址数据库为基础,通过发布可供标准REST接口调用的中文地理编码服务来满足用户的需求。  相似文献   

10.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

11.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

12.
重庆市标准地址模型与地址库研究与实践   总被引:2,自引:0,他引:2  
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。  相似文献   

13.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

14.
陈晔  何政伟  龚兵 《地理空间信息》2012,(1):67-69,72,3
介绍了决策树分类器的结构和理论基础,并结合了遥感影像各波段的特征对地物进行分类。在此基础上,以重庆渝北区为例进行了分类实验。实验说明了实现分类的具体过程,结果表明其方法在依据感兴趣区训练样本进行影像分类是切实可行的。  相似文献   

15.
阐述了地址的概念,通过对上海市地址现状的分析,提出了上海市鱼型结构地址模型及标准化过程。实践证明,鱼型结构地址模型相对于树型地址模型而言,消除了数据之间的冗余和数据之间的强依赖关系,为提高地址数据标准化效率提供了理论基础和实践经验。  相似文献   

16.
通过对测地线活动轮廓(GAC)模型、Chan-Vese(CV)模型、局部二值拟合(LBF)模型的分析,将基于边缘和区域的活动轮廓模型以及基于四叉树的影像分割方法有机结合,提出了一种基于四叉树和多种活动轮廓模型的水边线提取方法。该方法首先对影像进行四叉树分割,为模型演化提供初始轮廓;然后利用CV模型的全局区域图像统计信息和LBF模型的局部区域图像统计信息构造新的符号压力函数,利用改进的符号压力函数代替GAC模型的边界停止函数,有效地改善了GAC模型提前停止演化和过度演化的问题;最后采用二值选择和高斯滤波正则化水平集方法(SBGFRLS)进行演化,避免了重新初始化和规则化,提高了水平集演化的效率。试验结果表明该方法对于包括弱边缘和严重凹陷边缘的水边线提取效果均良好,具有亚像素提取精度,并且提取速度快、稳定性好。  相似文献   

17.
王勇  刘纪平  郭庆胜  罗安 《测绘学报》2016,45(5):623-630
针对互联网POI(兴趣点)地址信息中广泛存在的地址要素不完整、文字表达不一致等不规范现象,提出一种顾及位置关系的网络POI地址信息标准化处理方法,首先对POI信息进行切分提取并逐层匹配地址树模型;然后基于4种位置关系从标准POI库中选出相应集合,作为丰富和修正非标准POI地址要素的候选;最后通过最小粒度地址要素的回溯,实现POI地址信息的快速标准化处理。试验表明该方法可以获得较高的准确率,尤其适用于在互联网数据环境中的POI地址信息标准化。  相似文献   

18.
Web网站中存在种类繁多的地理信息,但由于格式、用户权限等限制,用户多数只能浏览,并不能直接利用。为有效地利用网站中大量的地理信息数据,本文介绍几种自动抓取Web网站中地理信息,并将地理信息转化成可直接利用的空间数据的方法,以实现批量操作空间数据。  相似文献   

19.
湿地是地球的重要组成部分,快速而准确地提取湿地信息,是湿地动态监测和可持续发展的一项基础而重要的工作.以洪泽湖淡水湿地为研究对象,采用2006年8月19日的Landsat5 TM遥感影像为数据源,采用经K-T变换光谱增强后的数据及利用灰度共生矩阵分析影像第一主成分的纹理统计量作辅助分类变量,基于地物光谱特征、纹理特征和形状特征,运用决策树分类法提取洪泽湖湿地植被信息,将其分类结果与最大似然法的分类结果进行比较.结果表明:1)洪泽湖地区的湿地植被比较丰富,面积约占全湖的10.74%,其中以浮水植物为主.2)基于决策树的分类结果的精度有了明显的提高,总精度由77.33%提高到86.33%,Kappa系数由0.7292提高到0.8354,证明基于决策树分类方法是提取淡水湿地植被信息的有效手段.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号