首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

2.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

3.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别.  相似文献   

4.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

5.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

6.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

7.
地址树模型的中文地址提取方法   总被引:1,自引:0,他引:1  
地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。  相似文献   

8.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

9.
在分析中文分词算法和交通信息自然语言表达特点基础上,提出了一种自然语言表达交通信息的跨阶匹配分词算法,以适应动态出行信息服务对数字形式结构化实时交通信息的迫切需求。该算法充分考虑了交通信息自然语言描述词库记录长度特点,通过设置对应的中文分词阶数,将传统中文分词的字符串指针1阶跨越方法改进为依词库性质变化的多阶跨越方法,对可能成词的中文字符串进行整体处理,极大地提高了自然语言表达交通信息的实时分词与理解效率。通过与改进MM(maximum matching)算法的实验比较,本方法在理解成功率和容错性相同的情况下,效率比MM分词算法提高了10倍以上。  相似文献   

10.
地址文本作为描述地理位置的字符串,通过对文本信息的解析可将自然地址描述转化为可被计算机识别的地理空间位置。通过分析地籍数据中地址文本的特点,设计了基于词典匹配算法的地址逐级标准化算法,并开发了相应的原型系统。实验结果的准确率高于95%,且有较高的操作效率,具有一定的地址文本解析价值。  相似文献   

11.
魏金明  仲伟政 《测绘科学》2015,40(1):122-125
针对市域地址数据特点,文章在地址编码和地址匹配现有研究成果的基础上,参照济南市地址使用习惯,提出了一种基于置信度的地址匹配方法。该方法以地址数据库为基础,依托规范化地址编码,利用分词算法和置信度筛选的方法匹配数据,通过人机交互的方式扩充地址库,实现了地址的自动匹配定位,提高了匹配的正确性。  相似文献   

12.
欧氏聚类算法是多元统计中的一种重要分类方法,可以将其应用于测绘领域中点云数据的分割。本文首先计算点云数据中两点之间的欧氏距离,将距离小于指定阈值作为分为一类的判定准则;然后迭代计算,直至所有的类间距大于指定阈值,完成欧氏聚类分割。具体步骤为:①利用Octree法建立点云数据拓扑组织结构;②对每个点进行k近邻搜索,计算该点与k个邻近点之间的欧氏距离,最小归为一类;③设置一定的阈值,对步骤②迭代计算,直至所有类与类之间的距离大于指定阈值。试验证明,欧氏聚类算法对不同测量技术手段获取的点云数据均具有适用性,可以成功对点云数据进行分割,分割效果良好。  相似文献   

13.
将遗传算法和蚁群算法组合对模糊聚类进行优化,巧妙地对图像的像素特征和空间特征进行提取,利用这些特征作为聚类依据,将图像的多个特征结合到智能计算中,充分利用了遗传算法和蚁群算法各自的优势和特点,既提高了图像分割的准确性,又加快了分割过程的速度。实验结果表明,遗传算法和蚁群组合算法优化的模糊聚类是一种性能良好的遥感图像分割方法。  相似文献   

14.
一种基于人工免疫的图像分割算法   总被引:4,自引:1,他引:4  
提出了二维熵图像分割的人工免疫算法。在遥感高分辨率图像上的实验显示,该算法不仅能准确搜索到最优阈值对,而且计算时间只有传统算法的1.8%。该算法也验证了人工免疫思想用于图像分割的可行性和有效性。  相似文献   

15.
针对目前遥感影像中面状水域提取算法的自动化程度不高的问题,本文提出了一种基于面积比分割的面状水域提取算法。首先,利用矢量数据提供的面积作为先验信息,对待提取的遥感影像进行图像分割,经过去噪、边缘检测等环节实现面状水域的初步提取;然后将初步提取的面状水域带入到主动轮廓模型中,作为初始边界对面状水域进行精确提取;最后,以天绘影像对上述算法进行验证,结果表明:该算法能够有效提取面状水域,提高现有算法的自动化程度。  相似文献   

16.
多尺度分割算法是面向对象的图像分析方法中的一种较为成熟、稳定的分割算法,但存在部分分割不准确和分割效率低等问题.为此,提出一种融合数学形态学运算的多尺度建筑物分割算法:首先利用高斯滤波器对遥感图像进行滤波处理,然后通过数学形态学运算对图像进行腐蚀处理,最后采用多尺度分割算法得到建筑物影像.对昆明市局部区域的QuickBird图像进行多尺度建筑物分割实验的结果表明,该算法具有分割精度高、效率快等优点,对类似工作有一定的借鉴意义.  相似文献   

17.
以天津市为例,基于全国第二次地名普查成果,结合道路门牌编码规则,提出了一种基于距离线性内插的门牌地址匹配方法,实现了大批量门牌地址文字信息的快速空间化,并成功应用于天津市地理国情普查项目。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号