首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
针对GIS地名搜索系统的关键技术,阐述了用于分词搜索的词典设计,设计了中文分词算法;选用全文检索引擎Lucene实现了地址匹配组件;设计了地名搜索系统架构并实现了地名搜索功能。  相似文献   

2.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

3.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。  相似文献   

4.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

5.
针对地名兴趣点的命名结构,阐述了用于中文分词的基本词库与简称词库的设计,选用IKAnalyzer实现中文分词。在分词基础上设计并实现了简称规则与算法,从而达到在不影响信息表达的基础上简化名称的目的。  相似文献   

6.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

7.
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

8.
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

9.
针对计算机进行GIS中文地址匹配困难的问题,提出了以词库为基础,采用中文分词算法和全文检索技术,确定中文语句和目标的相似性,并设计具体的推理方法,最终实现地名匹配并在地图上显示查询信息。  相似文献   

10.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

11.
GIS中文查询系统的词典设计与分词研究   总被引:3,自引:0,他引:3  
在分析系统应用领域的基础上设计了系统词典,提出了基于扩展ER空间数据库环境的全匹配分词算法,分析了算法的复杂度,解决了切分歧义和未登录词的问题,并通过一个实验原型对设计进行了验证,为GIS中文查询语句的正确理解提供了有效的语义信息。  相似文献   

12.
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的F1值。所提出的方法在泛化能力测试集上的F1值达到了0.940,在普通测试集上的F1值达到了0.968。  相似文献   

13.
空间信息自然语言查询接口的研究与应用   总被引:7,自引:0,他引:7  
提出了空间信息自然语言查询接口(SINLQI),并讨论了基于E—R语义词典的建立、中文分词、查询文法规则及其应用领域等主要问题。  相似文献   

14.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

15.
阐述了专门用于分词搜索的关键词词典设计,提出了采用逆向最大匹配和权重匹配相结合的方法,实现了更加准确、高效的地名搜索。  相似文献   

16.
多尺度分割算法是面向对象的图像分析方法中的一种较为成熟、稳定的分割算法,但存在部分分割不准确和分割效率低等问题.为此,提出一种融合数学形态学运算的多尺度建筑物分割算法:首先利用高斯滤波器对遥感图像进行滤波处理,然后通过数学形态学运算对图像进行腐蚀处理,最后采用多尺度分割算法得到建筑物影像.对昆明市局部区域的QuickBird图像进行多尺度建筑物分割实验的结果表明,该算法具有分割精度高、效率快等优点,对类似工作有一定的借鉴意义.  相似文献   

17.
孙立财  陈以松  熊杰  罗安  王勇 《测绘通报》2021,(10):108-113
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号