首页 | 本学科首页   官方微博 | 高级检索  
     检索      

地理编码系统中地名地址分词算法研究
引用本文:张林曼,吴升.地理编码系统中地名地址分词算法研究[J].测绘科学,2010,35(2):46-48.
作者姓名:张林曼  吴升
作者单位:福州大学福建省空间信息工程研究中心,空间数据挖掘与信息共享教育部重点实验室,福州,350002;福州大学福建省空间信息工程研究中心,空间数据挖掘与信息共享教育部重点实验室,福州,350002
基金项目:国家科技支撑计划,福建省科技重大专项专题项目,福建省科技计划重点项目,AMD合作项目奖励基金 
摘    要:对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。

关 键 词:GIS  地理编码  中文分词  地名

Research on place names and address segmentation in geocoding system
ZHANG Lin-man,WU Sheng.Research on place names and address segmentation in geocoding system[J].Science of Surveying and Mapping,2010,35(2):46-48.
Authors:ZHANG Lin-man  WU Sheng
Abstract:This paper focus on technology of Chinese word segmentation.According to the characteristics of geocoding system,a three-tier combination segmentation dictionary data structure based on double-character-hash-indexing and array list and a maximum forward segmentation matching algorithm of successively increasing word was proposed.At the same time,a generic terms dictionary of place names was constructed to identify the non-login words.The algorithm proposed in this paper could achieve a better effect in solving the problem of Chinese word segmentation in GIS.
Keywords:GIS  GIS  geoceding  Chinese word segmentation  place names
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号