共查询到19条相似文献,搜索用时 62 毫秒
1.
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景. 相似文献
2.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。 相似文献
3.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别. 相似文献
4.
在线地理编码服务是非专业用户最常用的非空间数据空间化的手段。然而,大量在线地理编码服务的出现增加了用户选择的困难,因此通过对主流的在线地理编码服务质量进行评价,为公众的日常应用提供选择上的指导,并有助于在线地理编码服务商发现服务存在的缺陷,进一步完善服务。基于国内主流的4种在线地理编码服务——百度、高德、搜狗和腾讯,采用与衣食住行相关的4类地址作为检验数据,分别从地址匹配率、地理编码服务位置精度和一致性三个方面,对4种服务进行质量评价,得到以下结论:造成4种服务质量差异的主要原因是其参考库的质量差异;高德地图有最高的地址匹配率和最差的位置精度;腾讯地图整体表现较为优异,具有较高的数据质量和较完备的地址数据。 相似文献
5.
6.
地理编码系统中地址匹配引擎的设计与实现 总被引:8,自引:0,他引:8
分析了地址匹配流程和几种模糊检索技术,选用了全文检索引擎包Lucene设计了地址匹配引擎,实现了基于XML Web Services的地理编码系统。 相似文献
7.
8.
9.
针对"数字湖北"地理空间框架建设,探讨了适合于湖北省省情的中文地理编码技术,将湖北省现有的地址实体进行空间化、规范化,建立标准化的地址数据库,并实现了湖北省中文地理编码服务共享。以标准地址数据库为基础,通过发布可供标准REST接口调用的中文地理编码服务来满足用户的需求。 相似文献
10.
11.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 相似文献
12.
13.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。 相似文献
14.
15.
陈明洁 《测绘与空间地理信息》2017,(3)
阐述了地址的概念,通过对上海市地址现状的分析,提出了上海市鱼型结构地址模型及标准化过程。实践证明,鱼型结构地址模型相对于树型地址模型而言,消除了数据之间的冗余和数据之间的强依赖关系,为提高地址数据标准化效率提供了理论基础和实践经验。 相似文献
16.
四叉树与多种活动轮廓模型相结合的遥感影像水边线提取方法 总被引:1,自引:0,他引:1
通过对测地线活动轮廓(GAC)模型、Chan-Vese(CV)模型、局部二值拟合(LBF)模型的分析,将基于边缘和区域的活动轮廓模型以及基于四叉树的影像分割方法有机结合,提出了一种基于四叉树和多种活动轮廓模型的水边线提取方法。该方法首先对影像进行四叉树分割,为模型演化提供初始轮廓;然后利用CV模型的全局区域图像统计信息和LBF模型的局部区域图像统计信息构造新的符号压力函数,利用改进的符号压力函数代替GAC模型的边界停止函数,有效地改善了GAC模型提前停止演化和过度演化的问题;最后采用二值选择和高斯滤波正则化水平集方法(SBGFRLS)进行演化,避免了重新初始化和规则化,提高了水平集演化的效率。试验结果表明该方法对于包括弱边缘和严重凹陷边缘的水边线提取效果均良好,具有亚像素提取精度,并且提取速度快、稳定性好。 相似文献
17.
18.
Web网站中存在种类繁多的地理信息,但由于格式、用户权限等限制,用户多数只能浏览,并不能直接利用。为有效地利用网站中大量的地理信息数据,本文介绍几种自动抓取Web网站中地理信息,并将地理信息转化成可直接利用的空间数据的方法,以实现批量操作空间数据。 相似文献
19.
湿地是地球的重要组成部分,快速而准确地提取湿地信息,是湿地动态监测和可持续发展的一项基础而重要的工作.以洪泽湖淡水湿地为研究对象,采用2006年8月19日的Landsat5 TM遥感影像为数据源,采用经K-T变换光谱增强后的数据及利用灰度共生矩阵分析影像第一主成分的纹理统计量作辅助分类变量,基于地物光谱特征、纹理特征和形状特征,运用决策树分类法提取洪泽湖湿地植被信息,将其分类结果与最大似然法的分类结果进行比较.结果表明:1)洪泽湖地区的湿地植被比较丰富,面积约占全湖的10.74%,其中以浮水植物为主.2)基于决策树的分类结果的精度有了明显的提高,总精度由77.33%提高到86.33%,Kappa系数由0.7292提高到0.8354,证明基于决策树分类方法是提取淡水湿地植被信息的有效手段. 相似文献