首页 | 本学科首页   官方微博 | 高级检索  
     

顾及字符特征的中文地名词典查询方法
引用本文:叶鹏,张雪英,杜咪. 顾及字符特征的中文地名词典查询方法[J]. 地球信息科学学报, 2018, 20(7): 880-886. DOI: 10.12082/dqxxkx.2018.170530
作者姓名:叶鹏  张雪英  杜咪
作者单位:1. 南京师范大学 虚拟地理环境教育部重点实验室, 南京 2100232. 江苏省地理信息资源开发与利用协同创新中心,南京 210023
基金项目:国家自然科学基金项目(41671393、41631177);国家重点研发计划(2017YFB0503602);江苏省高校自然资助项目(15KJA420002);公安部科技强警基础工作专项项目(2016GABJC43、2017GABJC23);警用地理信息技术公安部重点实验室开放课题(2016LPGIT01)
摘    要:地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(CGQM)。首先,查询具有相同字符特征的地名形成候选地名集合,同时构建单字索引提升查询效率;其次,依据字符数量特征比较查询地名与候选地名的差异,进一步过滤候选地名集合;最后,基于字符位置特征优化查询结果排序策略,使得结果排序更为合理。实验以全国地名词典为例,构建5组测试集进行CGQM方法与Lucene检索方法的对比分析。研究结果表明,CGQM方法对于增强地名词典查询功能、提升查询效率具有实际意义。

关 键 词:中文地名  地名词典查询  地名词典单字索引  地名相似度  地名字符特征  
收稿时间:2017-11-12

Query Method of Chinese Gazetteer Based on the Character Features
YE Peng,ZHANG Xueying,DU Mi. Query Method of Chinese Gazetteer Based on the Character Features[J]. Geo-information Science, 2018, 20(7): 880-886. DOI: 10.12082/dqxxkx.2018.170530
Authors:YE Peng  ZHANG Xueying  DU Mi
Affiliation:1. Key Laboratory of Virtual Geographic Environment, Nanjing Normal University, Ministry of Education, Nanjing 210023, China2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
Abstract:
Keywords:Chinese place name  gazetteer query  Chinese gazetteer index for single Chinese characters  the similarity of place name  place name character features  
本文献已被 CNKI 等数据库收录!
点击此处可从《地球信息科学学报》浏览原始摘要信息
点击此处可从《地球信息科学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号