首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
现有重庆市地址模型存在地址不完整、歧义、口语化等弊端。以南岸为例,针对现有数据特点,围绕地址数据库建设及地理编码的需求,归纳非结构化中文地址的特点,优化现有地址要素结构。提出了基于中文语义的地址模型构建方法,建立要素间拓扑关系,增加上下文约束力,引入支持向量机,有效避免中文自然语言表达歧义,提高地址解析的准确度和效率。  相似文献   

2.
刘现印  李玉琳  尹斌  田沁 《测绘科学》2021,46(8):165-171,212
中文地址解析是中文地址匹配最核心的问题.针对当前比较流行的基于条件随机场(CRF)或者基于规则的中文地址解析方法,该文结合深度学习中的双向门控循环网络(BiGRU)和CRF的方法来实现中文地址分词;并且针对当前的层次地址模型和四词位标注体系,该文采用 了基于空间关系地址模型和五词位的标注方法.然后分别采用基于规则的模型、CRF、BiGRU+SoftMax和BiGRU+CRF模型进行对比实验,发现该文提出的BiGRU+CRF模型配上新的空间关系地址模型及标注体系,可以对地址解析方面有更好的效果.  相似文献   

3.
空间关系地址模型及其表达模式分析   总被引:1,自引:0,他引:1  
地址模型是进行地址解析和地址匹配的基础。针对非规范中文地址,在层级地址模型、有限自动机模型的基础上,提出空间关系地址模型,并分析该模型的优势;阐述空间关系地址模型的结构,分析地址中空间关系的表达,将地址中的空间关系划分为包含关系、相交关系、模糊偏移关系、方向关系和距离关系;按照该模型设计相应的地址标注体系和规范,对按照该规范标注的地址标注语料进行基于HashTable地址模型树统计分析,分析顾及空间关系的中文地址的常用表达模式。  相似文献   

4.
复杂多变的中文地址结构使得在进行地址匹配时存在一定的局限性,影响地址匹配效率。针对该问题,研究了适合空间推理的空间约束地址模型。在分析中文地址的结构特点以及地址描述中存在的问题的基础上,以地址要素间的空间关系为切入点,构建该模型。进行推理匹配时,首先借助空间约束关系进行推理识别;然后,采用深度优先、集合查找的策略,同时正向推理所在城市作为集合查找左边界;最后,逆向推理最小目标地址要素直到获取最优目标地址。以中文地址作为实验数据进行推理匹配的可行性验证。试验结果表明,顾及空间关系的推理匹配方法可以有效解决地址描述的多样性和空间约束不一致性等问题,极大地提高了检索效率和匹配成功率。  相似文献   

5.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

6.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

7.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。  相似文献   

8.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

9.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义.  相似文献   

10.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

11.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

12.
郁汀  王铎  陈钦 《测绘通报》2022,(3):101-106
地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高。为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配。通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9。  相似文献   

13.
刘洋  赵婷婷  朱峰 《北京测绘》2020,(3):371-375
随着数字化的发展,越来越多的应用要求通过采用自然语言文字描述直接找到对应的详细的地址信息,并能够在空间位置上进行显示,即地名地址匹配空间化过程。然而,现今在地名的规范化角度还存在着很多问题,在乡镇或街道办及以上的行政等级的命名中都已基本规范统一,但是在村庄级的命名中还有待进一步的完善。所以本文通过对国内外文献研究,规范村名命名规律,匹配算法研究进一步加深中文村名俗称与规范名称的匹配算法的研究。  相似文献   

14.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

15.
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9 000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8 000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。  相似文献   

16.
地址树模型的中文地址提取方法   总被引:1,自引:0,他引:1  
地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。  相似文献   

17.
传统雷达图像的绘制一般采用直接的实时坐标变换算法,这种算法效率较低,而且无法从根本上解决雷达图像的死地址和显示盲区现象根据激光雷达特点以及图像绘制需求,设计并实现了一种基于查找表的激光雷达图像快速算法,能大大提高激光雷达图像的绘制速度,并能够较好地解决图像的死地址和显示盲区现象.  相似文献   

18.
以天津市为例,基于全国第二次地名普查成果,结合道路门牌编码规则,提出了一种基于距离线性内插的门牌地址匹配方法,实现了大批量门牌地址文字信息的快速空间化,并成功应用于天津市地理国情普查项目。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号