共查询到10条相似文献,搜索用时 652 毫秒
1.
2.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别. 相似文献
3.
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的 值。所提出的方法在泛化能力测试集上的 值达到了0.940,在普通测试集上的 值达到了0.968。 相似文献
4.
5.
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 相似文献
6.
《测绘科学技术学报》2020,(2)
地址解析是影响地址匹配精度十分重要的一部分。但中文地址结构复杂、表达方式多样,使得解析效果不理想,因此提出一种基于语义结构特征的地名解析方法。统计并分析山东村名的结构组成和语义特点,确定村名主要由核心成分、修饰成分和村名特征词组成。核心成分包括表示地形地貌、水文、植物动物、建筑工程等特征的10类字词,用这种结构分析俗称,可以总结出俗称与官方村名的对应关系。为了展现解析效果,设计一套标注体系,采用一般地址要素解析和地名解析的方法对比实验。结果表明,基于语义和结构特征的地名解析效果较好,能更准确和直观地体现村名中的区别特征,为解决地址解析中非规范地名的错误打好基础。 相似文献
7.
8.
《测绘地理信息》2020,(4)
复杂多变的中文地址结构使得在进行地址匹配时存在一定的局限性,影响地址匹配效率。针对该问题,研究了适合空间推理的空间约束地址模型。在分析中文地址的结构特点以及地址描述中存在的问题的基础上,以地址要素间的空间关系为切入点,构建该模型。进行推理匹配时,首先借助空间约束关系进行推理识别;然后,采用深度优先、集合查找的策略,同时正向推理所在城市作为集合查找左边界;最后,逆向推理最小目标地址要素直到获取最优目标地址。以中文地址作为实验数据进行推理匹配的可行性验证。试验结果表明,顾及空间关系的推理匹配方法可以有效解决地址描述的多样性和空间约束不一致性等问题,极大地提高了检索效率和匹配成功率。 相似文献
9.