首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于BERT-BiLSTM-CRF的中文地址解析方法
引用本文:吴恪涵,张雪英,叶鹏,怀安,张航.基于BERT-BiLSTM-CRF的中文地址解析方法[J].地理与地理信息科学,2021,37(4):10-15.
作者姓名:吴恪涵  张雪英  叶鹏  怀安  张航
作者单位:自然资源部城市国土资源监测与仿真重点实验室,广东 深圳518034;南京师范大学虚拟地理环境教育部重点实验室/江苏省地理信息资源开发与利用协同创新中心,江苏 南京210023
摘    要:中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面.但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题.为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力.以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能.

关 键 词:中文地址  地址要素分类  地址标注  BERT-BiLSTM-CRF  地址解析模型

A Chinese Address Resolution Method Based on BERT-BiLSTM-CRF
WU Ke-han,ZHANG Xue-ying,YE Peng,HUAI An,ZHANG Hang.A Chinese Address Resolution Method Based on BERT-BiLSTM-CRF[J].Geography and Geo-Information Science,2021,37(4):10-15.
Authors:WU Ke-han  ZHANG Xue-ying  YE Peng  HUAI An  ZHANG Hang
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号