期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周海杜泽欣范瑞杰马雷雷梁汝鹏《测绘工程》2016,25(5):25-31

地址模型是进行地址解析和地址匹配的基础。针对非规范中文地址,在层级地址模型、有限自动机模型的基础上,提出空间关系地址模型,并分析该模型的优势;阐述空间关系地址模型的结构,分析地址中空间关系的表达,将地址中的空间关系划分为包含关系、相交关系、模糊偏移关系、方向关系和距离关系;按照该模型设计相应的地址标注体系和规范,对按照该规范标注的地址标注语料进行基于HashTable地址模型树统计分析,分析顾及空间关系的中文地址的常用表达模式。相似文献

2.

基于条件随机场模型的中文地址分词研究

杨德彬马卫春《测绘与空间地理信息》2021,44(11):73-75,79

地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别. 相似文献

3.

一种使用RoBERTa-BiLSTM-CRF的中文地址解析方法

下载免费PDF全文

张红伟杜清运陈张建张琛《武汉大学学报(信息科学版)》2022,47(5):665-672

针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的

F_{1}

值。所提出的方法在泛化能力测试集上的

F_{1}

值达到了0.940,在普通测试集上的

F_{1}

值达到了0.968。相似文献

4.

重庆市中文语义地址模型构建方法探讨

臧英斐王斌瞿晓雯《地理空间信息》2015,(3):122-125

现有重庆市地址模型存在地址不完整、歧义、口语化等弊端。以南岸为例,针对现有数据特点,围绕地址数据库建设及地理编码的需求,归纳非结构化中文地址的特点,优化现有地址要素结构。提出了基于中文语义的地址模型构建方法,建立要素间拓扑关系,增加上下文约束力,引入支持向量机,有效避免中文自然语言表达歧义,提高地址解析的准确度和效率。相似文献

5.

自然语言理解的中文地址匹配算法

宋子辉《遥感学报》2013,17(4):788-801

地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。相似文献

6.

结合语义结构特征的区域村名解析

《测绘科学技术学报》2020,(2)

地址解析是影响地址匹配精度十分重要的一部分。但中文地址结构复杂、表达方式多样,使得解析效果不理想,因此提出一种基于语义结构特征的地名解析方法。统计并分析山东村名的结构组成和语义特点,确定村名主要由核心成分、修饰成分和村名特征词组成。核心成分包括表示地形地貌、水文、植物动物、建筑工程等特征的10类字词,用这种结构分析俗称,可以总结出俗称与官方村名的对应关系。为了展现解析效果,设计一套标注体系,采用一般地址要素解析和地名解析的方法对比实验。结果表明,基于语义和结构特征的地名解析效果较好,能更准确和直观地体现村名中的区别特征,为解决地址解析中非规范地名的错误打好基础。相似文献

7.

中文文本的地理空间关系标注 总被引：1，自引：0，他引：1

张雪英张春菊朱少楠《测绘学报》2012,41(3):468-474

为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。相似文献

8.

空间约束地址模型及推理匹配方法研究

《测绘地理信息》2020,(4)

复杂多变的中文地址结构使得在进行地址匹配时存在一定的局限性,影响地址匹配效率。针对该问题,研究了适合空间推理的空间约束地址模型。在分析中文地址的结构特点以及地址描述中存在的问题的基础上,以地址要素间的空间关系为切入点,构建该模型。进行推理匹配时,首先借助空间约束关系进行推理识别;然后,采用深度优先、集合查找的策略,同时正向推理所在城市作为集合查找左边界;最后,逆向推理最小目标地址要素直到获取最优目标地址。以中文地址作为实验数据进行推理匹配的可行性验证。试验结果表明,顾及空间关系的推理匹配方法可以有效解决地址描述的多样性和空间约束不一致性等问题,极大地提高了检索效率和匹配成功率。相似文献

9.

城市地址要素组合模式分析——以深圳市为例

叶鹏张雪英王铁《测绘科学》2022,47(2):192-199

为了深入探测城市地址数据对于地理位置表达的描述特点,该文提出一种城市地址要素组合模式的分析方法.在构建城市地址要素多级分类体系的基础上,通过标注地址语料归纳规则模型进行地址要素解析,进一步分析城市地址中各类要素的组合模式.以深圳市1 700多万条地址数据为例,分析出使用频率最高的17种地址要素组合模式.期望研究结果在我... 相似文献

10.

地址树模型的中文地址提取方法 总被引：1，自引：0，他引：1

亢孟军杜清运王明军《测绘学报》2015,44(1):99-107

地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。相似文献