共查询到17条相似文献,搜索用时 140 毫秒
1.
陈德权 《测绘与空间地理信息》2013,(8):58-60
针对GIS地名搜索系统的关键技术,阐述了用于分词搜索的词典设计,设计了中文分词算法;选用全文检索引擎Lucene实现了地址匹配组件;设计了地名搜索系统架构并实现了地名搜索功能。 相似文献
2.
3.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。 相似文献
4.
5.
6.
7.
8.
9.
针对计算机进行GIS中文地址匹配困难的问题,提出了以词库为基础,采用中文分词算法和全文检索技术,确定中文语句和目标的相似性,并设计具体的推理方法,最终实现地名匹配并在地图上显示查询信息。 相似文献
10.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 相似文献
11.
GIS中文查询系统的词典设计与分词研究 总被引:3,自引:0,他引:3
在分析系统应用领域的基础上设计了系统词典,提出了基于扩展ER空间数据库环境的全匹配分词算法,分析了算法的复杂度,解决了切分歧义和未登录词的问题,并通过一个实验原型对设计进行了验证,为GIS中文查询语句的正确理解提供了有效的语义信息。 相似文献
12.
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的 值。所提出的方法在泛化能力测试集上的 值达到了0.940,在普通测试集上的 值达到了0.968。 相似文献
13.
空间信息自然语言查询接口的研究与应用 总被引:7,自引:0,他引:7
提出了空间信息自然语言查询接口(SINLQI),并讨论了基于E—R语义词典的建立、中文分词、查询文法规则及其应用领域等主要问题。 相似文献
14.
15.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。 相似文献
16.
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 相似文献