共查询到17条相似文献,搜索用时 62 毫秒
1.
2.
3.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别. 相似文献
4.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 相似文献
5.
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景. 相似文献
6.
7.
8.
9.
在分析中文分词算法和交通信息自然语言表达特点基础上,提出了一种自然语言表达交通信息的跨阶匹配分词算法,以适应动态出行信息服务对数字形式结构化实时交通信息的迫切需求。该算法充分考虑了交通信息自然语言描述词库记录长度特点,通过设置对应的中文分词阶数,将传统中文分词的字符串指针1阶跨越方法改进为依词库性质变化的多阶跨越方法,对可能成词的中文字符串进行整体处理,极大地提高了自然语言表达交通信息的实时分词与理解效率。通过与改进MM(maximum matching)算法的实验比较,本方法在理解成功率和容错性相同的情况下,效率比MM分词算法提高了10倍以上。 相似文献
10.
11.
针对市域地址数据特点,文章在地址编码和地址匹配现有研究成果的基础上,参照济南市地址使用习惯,提出了一种基于置信度的地址匹配方法。该方法以地址数据库为基础,依托规范化地址编码,利用分词算法和置信度筛选的方法匹配数据,通过人机交互的方式扩充地址库,实现了地址的自动匹配定位,提高了匹配的正确性。 相似文献
12.
欧氏聚类算法是多元统计中的一种重要分类方法,可以将其应用于测绘领域中点云数据的分割。本文首先计算点云数据中两点之间的欧氏距离,将距离小于指定阈值作为分为一类的判定准则;然后迭代计算,直至所有的类间距大于指定阈值,完成欧氏聚类分割。具体步骤为:①利用Octree法建立点云数据拓扑组织结构;②对每个点进行k近邻搜索,计算该点与k个邻近点之间的欧氏距离,最小归为一类;③设置一定的阈值,对步骤②迭代计算,直至所有类与类之间的距离大于指定阈值。试验证明,欧氏聚类算法对不同测量技术手段获取的点云数据均具有适用性,可以成功对点云数据进行分割,分割效果良好。 相似文献
13.
将遗传算法和蚁群算法组合对模糊聚类进行优化,巧妙地对图像的像素特征和空间特征进行提取,利用这些特征作为聚类依据,将图像的多个特征结合到智能计算中,充分利用了遗传算法和蚁群算法各自的优势和特点,既提高了图像分割的准确性,又加快了分割过程的速度。实验结果表明,遗传算法和蚁群组合算法优化的模糊聚类是一种性能良好的遥感图像分割方法。 相似文献
14.
一种基于人工免疫的图像分割算法 总被引:4,自引:1,他引:4
提出了二维熵图像分割的人工免疫算法。在遥感高分辨率图像上的实验显示,该算法不仅能准确搜索到最优阈值对,而且计算时间只有传统算法的1.8%。该算法也验证了人工免疫思想用于图像分割的可行性和有效性。 相似文献
15.
针对目前遥感影像中面状水域提取算法的自动化程度不高的问题,本文提出了一种基于面积比分割的面状水域提取算法。首先,利用矢量数据提供的面积作为先验信息,对待提取的遥感影像进行图像分割,经过去噪、边缘检测等环节实现面状水域的初步提取;然后将初步提取的面状水域带入到主动轮廓模型中,作为初始边界对面状水域进行精确提取;最后,以天绘影像对上述算法进行验证,结果表明:该算法能够有效提取面状水域,提高现有算法的自动化程度。 相似文献
16.
17.
以天津市为例,基于全国第二次地名普查成果,结合道路门牌编码规则,提出了一种基于距离线性内插的门牌地址匹配方法,实现了大批量门牌地址文字信息的快速空间化,并成功应用于天津市地理国情普查项目。 相似文献