首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

2.
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

3.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别.  相似文献   

4.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

5.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

6.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

7.
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。  相似文献   

8.
在数字城市信息资源的集成和融合中,地名地址匹配是一项非常关键的基础技术。由于中文语义和地名地址描述的复杂性,中文地址的匹配比英文要复杂得多,基于海量中文地址数据进行准确分词,实现快速高效的地址匹配是城市数据集成融合的关键问题。本文在对现有地址编码及分词技术研究的基础上,通过一种基于规则和统计的组合方法来实现中文地址分词,并且使用K叉树的结构实现对中文地址的存储,提高了中文地址匹配查询的准确度和效率。基于预处理后的10 000个深圳市地址数据,通过开发原型系统对该方法进行了比较测试,验证了该方法的有效性。  相似文献   

9.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

10.
王勇  刘纪平  郭庆胜  罗安 《测绘学报》2016,45(5):623-630
针对互联网POI(兴趣点)地址信息中广泛存在的地址要素不完整、文字表达不一致等不规范现象,提出一种顾及位置关系的网络POI地址信息标准化处理方法,首先对POI信息进行切分提取并逐层匹配地址树模型;然后基于4种位置关系从标准POI库中选出相应集合,作为丰富和修正非标准POI地址要素的候选;最后通过最小粒度地址要素的回溯,实现POI地址信息的快速标准化处理。试验表明该方法可以获得较高的准确率,尤其适用于在互联网数据环境中的POI地址信息标准化。  相似文献   

11.
针对当前地址匹配方法严重依赖分词词典、无法有效识别地址中的地址元素及其所属类型的问题,提出了使用深度学习的中文地址解析方法,该方法能够对解析后的地址进行标准化和构成分析以改善地址匹配结果。通过对地址的不同词向量表示及不同序列标注模型的对比评估,结果表明,使用双向门递归单元和双向长短时记忆网络对中文地址解析差别较小,稀疏注意力机制有助于提高地址解析的F1值。所提出的方法在泛化能力测试集上的F1值达到了0.940,在普通测试集上的F1值达到了0.968。  相似文献   

12.
徐杰  侯飞  曹广航 《测绘通报》2022,(1):155-158
本文提出一种基于车载移动测量、倾斜摄影等多源数据成果的高精道路地图互补采集方法,并对其关键技术进行了深入研究。首先以国内第一条基于自动驾驶的智能网联高速公路测试路段——淄博智能网联测试基地为例,开展了激光点云、全景照片、倾斜影像等多源数据获取及高精道路地图要素采集。然后以道路三维矢量要素自动提取为基础,辅以人工采编,并在数据差分解算中测试了我国北斗数据。实例表明,本文方法切实可行、精度可靠,有效改善了高精道路地图采集模式,降低了劳动强度,保障了人身安全,提高了作业效率,对于高精道路地图制作具有借鉴价值。  相似文献   

13.
Address matching is a substantial task in location-based services. Currently, major address matching methods either perform rather badly on unstructured data or fail to extract adequate semantic information of address elements. In this article, we propose a graph-based method that can deal with both sides of the problem. First, we use a pretrained transformer neural network to handle address tokenization. Then we parse address tokens into address elements according to their parts of speech. Then the node2vec and tf-idf technique is used to generate node embeddings for each address element. Finally, an address matching graph convolutional network is applied to do the address matching work. We have carried out a series of experiments on a real-world Chinese address corpus, to further evaluate the impacts of our methods. The experimental results indicate our method achieves higher scores than the state-of-the-art methods.  相似文献   

14.
针对高动态、半结构化的轨迹数据,充分利用文档型非关系数据库MongoDB的特性,本文首先提出了一套分层、分区、分片的存储策略,设计了以整条轨迹为基本粒度的非关系组织模型,能够有效应对轨迹数据的海量性和动态性挑战。然后据此开展轨迹相似性分析的研究,提出了一种兼顾时间维和轨迹形状的轨迹相似性度量方法DTWEUCLI,可计算长短不一且含有噪声的轨迹数据之间的相似性。最后基于轨迹的非关系存储和相似性计算,开展了轨迹簇生成的试验与分析,设计实现了基于轨迹相似性计算的轨迹聚类计算框架。基于3个轨迹数据集的试验表明,DTWEUCLI算法能够对多源轨迹数据集进行有效聚类,输出轨迹簇。  相似文献   

15.
自2002~2003年度首次启用遥感技术监测黄河凌情以来,到目前已连续进行了10个年度。10个年度的生产实践表明:国产高分辨率卫星遥感数据能够有效跟踪黄河凌情的发展过程,实现黄河凌情的日动态监测、重点时段的精细监测和突发凌汛灾害时的实时监测。黄河凌情尤其在封开河阶段,日变化非常显著,中巴资源卫星作为国产高分辨率可见光民用遥感卫星的代表,以其大视场、高空间、高时间分辨率的特点,动态监测凌情,基本做到每天实现一次全覆盖监测的能力,配合其他如中国遥感卫星等高分辨率可见光、雷达数据,初步实现了凌情发展预估、开河前的河道槽蓄水量计算、封开河期间冰凌险情监测以及发生凌汛灾害时灾情信息采集与评估,为黄河防凌调度、决策会商提供了有力的技术支持。  相似文献   

16.
针对全球海量地理信息数据成果数据量大、数据类型丰富、质量检查内容多的特点,本文将分布式并行计算技术、多线程技术应用到地理信息数据质量控制体系中,基于MapReduce框架实现了多源多时相海量数据并行质量控制,把算法结构由一个周期执行一个操作改造为一个周期执行多个操作的并行处理,从根本上解决重复操作多、计算慢的质量检查难题。选取核心矢量要素、DOM成果、DEM成果作为典型数据案例开展效率对比试验。试验结果表明,该技术方案的处理效率比传统技术方案提高2~3倍,有效地压缩了任务执行时间,节约了任务执行成本,实现了对海量地理信息数据的快速质量控制,保障了全球地理信息数据的成果质量。  相似文献   

17.
以激光点云数据和倾斜多视影像为研究对象,提出了一种结合机载点云、地面点云及倾斜多视纹理的融合多源特征的建筑物三维模型重建方法。该方法结合点云面元以及影像边界特征,利用倾斜影像的线特征对顶面及立面模型进行边界规则约束,实现了面元自动拓扑重建;通过交互编辑完成不同复杂程度的建筑模型重建,并对模型进行纹理映射。实验结果表明,该方法能够有效提升城市建筑物三维模型重建的效率和边界精度,为利用多源数据的空地联合建筑物三维精细重建提供了一套切实可行的解决方案。  相似文献   

18.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

19.
自发地理信息(VGI)是一种新兴的地理数据采集方式,具有数据更新快、细节丰富、覆盖范围广等优势。利用VGI数据可以对道路网实现快速更新;但是由于VGI数据是非专业自发共享的,且数据采集时多使用非专业设备,所以存在数据质量不高的问题。大量VGI数据对同一地理要素的重复采集与融合处理则可改善数据的质量,文中以多人采集的道路网数据为例,结合矢量要素的匹配与融合理论,设计一种适用于道路网VGI数据的匹配与融合算法。首先在路段结点处建立缓冲区进行结点匹配,再根据路段距离相似度进行路段匹配,最后再利用Delaunay三角剖分融合算法对匹配后的同名路段进行融合。将匹配融合后的道路网与原始道路网VGI数据及Google影像图叠加对比分析,结果表明利用本文算法可有效地实现道路网VGI数据的匹配与融合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号