共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 相似文献
4.
5.
《测绘科学技术学报》2013,(5)
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。 相似文献
6.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 相似文献
7.
8.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义. 相似文献
9.
10.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。 相似文献
11.
中文地址解析是中文地址匹配最核心的问题.针对当前比较流行的基于条件随机场(CRF)或者基于规则的中文地址解析方法,该文结合深度学习中的双向门控循环网络(BiGRU)和CRF的方法来实现中文地址分词;并且针对当前的层次地址模型和四词位标注体系,该文采用 了基于空间关系地址模型和五词位的标注方法.然后分别采用基于规则的模型、CRF、BiGRU+SoftMax和BiGRU+CRF模型进行对比实验,发现该文提出的BiGRU+CRF模型配上新的空间关系地址模型及标注体系,可以对地址解析方面有更好的效果. 相似文献
12.
兴趣点(POI)是电子地图、导航等应用关注的主要要素之一,其数据质量直接影响地理信息服务的智能化水平。鉴于OpenStreetMap(OSM)等众源地理信息数据的非专业收集特征,其POI数据标签常存在缺失、标记错误等质量问题,亟须对POI标签进行智能化推断和增强处理。常规神经网络模型直接从单一层次预测多类别数据,未考虑POI类别在数量上分布不平衡的问题,其预测标签倾向于包含较多数据的类别,学习算法难以泛化小规模样本规则。本文考虑到不同POI类别间的数据规模差异较大,提出基于多层次POI类别组织的神经网络预测方法,通过小样本类别的层次化聚合,建立POI类别树结构,在树结构的不同层次上实现数据规模相对平衡的类别划分,支持神经网络高精度的标签预测。试验表明,本文方法仅需利用POI基础位置信息与邻近关系,其预测精度高于传统方法。 相似文献
13.
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 相似文献
14.
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。 相似文献
15.
建筑物要素合并是大比例尺地图缩编过程中实现空间结构简化的重要手段。基于综合规则的合并方法难以同时顾及要素形态、分布等诸多特征,受预设算法参数影响大,综合过程缺乏灵活性。针对这一问题,本文提出了一种基于图顶点深度聚类网络的建筑物合并模型,利用Delaunay三角网构建建筑物群组表征图模型,结合自编码器与图卷积网络学习剖分三角形的几何形态、空间分布特征,采用自监督学习方式实现三角形的聚类与分类(保留、删除),最终在不依赖样本条件下实现建筑物要素端到端智能化合并。试验表明,该方法对预设合并参数依赖低,能同时顾及建筑物要素的形态与分布特征。合并过程具有一定灵活性,合并结果能较好满足地图可视化要求。 相似文献
16.
传统基于深度卷积神经网络的场景分类方法往往需要大量标记样本用于模型的参数训练,在标记训练集数量有限的情况下,学习得到的特征泛化能力降低.针对这一问题,本文提出了高分影像分类的半监督深度卷积神经网络学习方法(3sCNN),采用自学习半监督策略,训练阶段不断增加训练样本:首先,通过有限的标记数据对深度网络进行初步训练;然后,利用经过初步训练的网络对未标记数据进行预测,得到未标记样本的预测标签及其对应的置信度;最后,将具有高置信度的未标记样本作为真实标记数据加入到训练集中,继续对网络进行训练并重复上述过程.为验证算法的有效性,本文在3个常用数据集上进行试验,试验结果证明本文算法可以有效提高有限样本下高分影像场景分类精度. 相似文献
17.
18.
兴趣点,又称POI(points of interest)是网络地图、导航地图中重要的表达要素,包括餐饮、娱乐、金融机构、旅游景点、地标建筑、加油站、停车场等人们日常生活中最为经常使用的信息。其数据的准确性、属性的丰富程度、表达的清晰度及其实时显示效率都将影响地图的服务质量。当前POI表达存在许多问题,特别是在用户搜索特定信息时,由于查询结果数据量较大,造成POI的叠置、压盖等,这一问题严重影响了用户对POI信息的查询与检索。地图综合提供了大量的算子算法以实现点或点群要素的选取,但是它们在综合效率方面亟待提高。面向矢量数据处理的并行计算,其数据划分不仅需要满足负载均衡、划分算法高效等要求,而且对于划分后各部分数据在计算前后拓扑关系的保持也显得尤为重要。兴趣点与路划网络是密切相关的要素,两者之间存在着相互依存的空间关系。本文提出基于路划网眼划分兴趣点的方法,既能保证兴趣点的划分效率,又能保证不同分区内POI选取计算的正确性。选择点选取算法中的"圆"增长算法,采用典型试验区域的路划网眼数据,基于不同节点数划分兴趣点数据,实现兴趣点选取并行计算。试验证明,该方法不仅保证了兴趣点划分的均衡性,而且可以提高兴趣点选取计算效率。通过这一研究,对面向矢量数据的地理信息分析、地图制图综合等复杂算法的并行计算具有重要意义。 相似文献
19.
《测绘地理信息》2020,(4)
复杂多变的中文地址结构使得在进行地址匹配时存在一定的局限性,影响地址匹配效率。针对该问题,研究了适合空间推理的空间约束地址模型。在分析中文地址的结构特点以及地址描述中存在的问题的基础上,以地址要素间的空间关系为切入点,构建该模型。进行推理匹配时,首先借助空间约束关系进行推理识别;然后,采用深度优先、集合查找的策略,同时正向推理所在城市作为集合查找左边界;最后,逆向推理最小目标地址要素直到获取最优目标地址。以中文地址作为实验数据进行推理匹配的可行性验证。试验结果表明,顾及空间关系的推理匹配方法可以有效解决地址描述的多样性和空间约束不一致性等问题,极大地提高了检索效率和匹配成功率。 相似文献