首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 47 毫秒
1.
宋子辉 《遥感学报》2013,17(4):788-801
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。  相似文献   

2.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

3.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

4.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。  相似文献   

5.
在数字城市信息资源的集成和融合中,地名地址匹配是一项非常关键的基础技术。由于中文语义和地名地址描述的复杂性,中文地址的匹配比英文要复杂得多,基于海量中文地址数据进行准确分词,实现快速高效的地址匹配是城市数据集成融合的关键问题。本文在对现有地址编码及分词技术研究的基础上,通过一种基于规则和统计的组合方法来实现中文地址分词,并且使用K叉树的结构实现对中文地址的存储,提高了中文地址匹配查询的准确度和效率。基于预处理后的10 000个深圳市地址数据,通过开发原型系统对该方法进行了比较测试,验证了该方法的有效性。  相似文献   

6.
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

7.
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9 000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8 000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。  相似文献   

8.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

9.
复杂多变的中文地址结构使得在进行地址匹配时存在一定的局限性,影响地址匹配效率。针对该问题,研究了适合空间推理的空间约束地址模型。在分析中文地址的结构特点以及地址描述中存在的问题的基础上,以地址要素间的空间关系为切入点,构建该模型。进行推理匹配时,首先借助空间约束关系进行推理识别;然后,采用深度优先、集合查找的策略,同时正向推理所在城市作为集合查找左边界;最后,逆向推理最小目标地址要素直到获取最优目标地址。以中文地址作为实验数据进行推理匹配的可行性验证。试验结果表明,顾及空间关系的推理匹配方法可以有效解决地址描述的多样性和空间约束不一致性等问题,极大地提高了检索效率和匹配成功率。  相似文献   

10.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

11.
陈石  徐伟民  王谦身 《测绘学报》2017,46(8):952-960
根据经典的球谐函数方法,为满足正交化要求,观测数据需要覆盖整个球面,而对于地表局部测量数据,则无法应用球谐方法解算重力场模型。针对此问题,采用Slepian局部谱分析方法解算中国大陆范围内的实测重力场变化数据,并以GOCE卫星球谐函数解作为已知模型,评估由于实际陆地重力测点的非均匀分布对球谐函数解的误差影响。通过计算多个阶次中国大陆局部范围的Slepian基函数分布;采用GOCE卫星获得重力场模型的前72阶球谐系数作为已知结果,评价实际测点非均匀分布的解算有效性,并针对中国大陆地区采用Slepian基函数进行解算,通过模型对比选择最优截段项数;针对2005—2008年中国大陆地区流动重力测量获得的重力场变化信号进行解算,获得了72阶重力场变化模型。  相似文献   

12.
双语地图中地图注记的设计   总被引:1,自引:1,他引:0  
从汉语地名的译写现状出发,对目前采用的两类地名译写方法进行分析,总结了地名翻译过程中的"专名音译,通名意译"的一般原则和相关要点。随后探讨加入英文注记后信息量增加、英文字符和排列等因素带来的双语地图在注记字体、尺寸、字隔、配置四个方面设计上与传统地图的不同之处;并结合编制广州市2010年亚运场馆分布地图的的实践,探讨如何在双语地图中对地物信息进行科学、清晰、美观的语言表达。  相似文献   

13.
郁汀  王铎  陈钦 《测绘通报》2022,(3):101-106
地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高。为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配。通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9。  相似文献   

14.
一种实用的点状符号库快速建立与显示方法   总被引:1,自引:0,他引:1  
从TrueType格式的特点出发,探讨了建立TrueType格式点状符号库的新思路。经实践,这种方式能克服传统的点状符号库在绘制时容易出现锯齿、变形的现象,符号外形美观,而且绘制速度快。  相似文献   

15.
随着近年来中国出境客流井喷式增长,国内用户对境外交通地图产品的需求不断增加。长期以来,境外道路数据因其数据资源较少,道路标准与国内存在较大差异,导致国内用户对其理解与应用等方面都存在着较大难度。境外道路数据在三维环境下的可视化研究工作旨在增强地图表现力,提高用户在难以接触实地情况下的快速认知水平。本文基于空间认知理论,结合地图学和色彩学等学科的知识,对境外矢量道路数据的三维可视化方法进行研究,提出了基于Google Earth平台Open StreetMap(OSM)道路数据的二级解译模式和三维环境下道路符号中的视觉层次建立方法,并在EV-Globe海量空间信息平台的三维环境中进行实验。  相似文献   

16.
VLBI在探月卫星定位中的应用分析   总被引:3,自引:1,他引:2  
中国实施的"嫦娥"探月工程中,探月卫星的定轨测控系统由我国现有的S频段航天测控网(USB)和甚长基线干涉测量(VLBI)系统组成。系统中,VLBI技术主要为绕月卫星定轨提供卫星的角位置。本文分析了在探月项目中,VLBI单点定位的必要性。探讨了VLBI技术用于探月卫星单点定位的基本原理及其实现方法。通过算例对模拟数据进行处理,检验了方法的正确性。对结果进行分析,得出一些结论。  相似文献   

17.
中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

18.
针对手写汉字文本识别准确率不高的问题,提出了一种结合卷积神经网络和循环神经网络进行手写汉字文本识别的端到端方法。首先,通过Inception模块构建的卷积神经网络提取文本图像的基本特征;然后,使用循环神经网络对提取的特征进行预测,并输出一个关于汉字字符集的概率分布;最后,采用连接主义序列分类算法计算识别结果并构建损失函数。利用所提方法在手写汉字文本数据集上进行实验, 结果表明,Inception模块和数据增强方法可以有效提升算法的性能,并取得了71.2%的识别准确率和0.060的文本编辑距离,较现有方法性能有所提升,证明了所提方法的有效性。  相似文献   

19.
提出了建立中国地区高精度地面参考架(CHTRF)的建议和设想。先论述了用高精度空间大地测量技术建立CHTRF的必要性和可能性,给出了CHTRF的严格定义,接着详细讨论了CHTRF的建立和维持问题。指出要维持一个高精度CHTRF,必须建立中国地区地壳运动速度场,并提出了速度场的建立方法。最后讨论了CHTRF与全球ITRF的连接。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号