深度学习的中文地址切分算法北大核心CSCD |
| |
引用本文: | 李一,刘纪平,罗安.深度学习的中文地址切分算法北大核心CSCD[J].测绘科学,2018(10):107-111. |
| |
作者姓名: | 李一 刘纪平 罗安 |
| |
作者单位: | 1.兰州交通大学730070;2.中国测绘科学研究院100830; |
| |
基金项目: | 中国测绘科学研究院基本科研业务费项目(7771605) |
| |
摘 要: | 针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。
|
关 键 词: | 中文分词 Bigram二分法 深度学习 地址要素 |
本文献已被 维普 等数据库收录! |
|