结合BERT与BiGRU-Attention-CRF模型的地质命名实体识别 |
| |
引用本文: | 谢雪景, 谢忠, 马凯, 陈建国, 邱芹军, 李虎, 潘声勇, 陶留锋. 2023. 结合BERT与BiGRU-Attention-CRF模型的地质命名实体识别. 地质通报, 42(5): 846-855. doi: 10.12097/j.issn.1671-2552.2023.05.014 |
| |
作者姓名: | 谢雪景 谢忠 马凯 陈建国 邱芹军 李虎 潘声勇 陶留锋 |
| |
作者单位: | 1.国家信息系统工程技术研究中心, 湖北 武汉 430074; 2.中国地质大学(武汉)计算机学院, 湖北 武汉 430074; 3.三峡大学计算机与信息学院, 湖北 宜昌 443002; 4.中国地质大学(武汉)资源学院, 湖北 武汉 430074; 5.济南轨道交通集团有限公司, 山东 济南 250000; 6.武汉中地数码科技有限公司, 湖北 武汉 430074 |
| |
基金项目: | 国家自然科学基金项目《地球科学知识图谱表示模式与群智协同构建》(批准号: 42050101)、湖北省自然科学基金项目《复杂地质实体及其关系精准抽取方法研究》(编号: 2022CFB640)和山东省重大科技创新工程项目《数字孪生城市四维可视化信息系统及其在济南城区的应用》(编号: 2019JZZY020105) |
| |
摘 要: | 从地质文本中提取地质命名实体, 对地质大数据的深度挖掘与应用具有重要意义。定义了地质命名实体的概念并制订了标注规范, 设计了地质实体对象化表达模型。地质文本存在大量长实体、复杂嵌套实体, 增加了地质命名实体识别的挑战性。 针对上述问题, ①引入BERT模型生成顾及上下文信息的高质量词向量表征; ②采用双向门控循环单元-注意力机制-条件随机场(BiGRU-Attention-CRF)对前一层输出的语义编码进行序列标注与解码。通过与主流深度学习模型进行对比, 该模型的F1值为84.02%, 均比其他模型表现出更优异的性能, 能在小规模地质语料库上有较好的识别效果。
|
关 键 词: | 命名实体识别 地质命名实体 BERT 注意力机制 BiGRU |
收稿时间: | 2021-03-30 |
修稿时间: | 2021-06-10 |
|
| 点击此处可从《地质通报》浏览原始摘要信息 |
|
点击此处可从《地质通报》下载全文 |
|