基于BERT-BiLSTM-CRF模型的地理实体命名实体识别 |
| |
引用本文: | 汤洁仪,李大军,刘波.基于BERT-BiLSTM-CRF模型的地理实体命名实体识别[J].北京测绘,2023(2):143-147. |
| |
作者姓名: | 汤洁仪 李大军 刘波 |
| |
作者单位: | 东华理工大学测绘工程学院 |
| |
基金项目: | 国家自然科学基金(42161064);;江西省自然科学基金(20212BAB204003); |
| |
摘 要: | 互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。
|
关 键 词: | 地理实体 命名实体识别(NER) 知识抽取 BERT-BiLSTM-CRF模型 |
|