首页 | 本学科首页   官方微博 | 高级检索  
     

结合BERT与BiGRU-Attention-CRF模型的地质命名实体识别
引用本文:谢雪景, 谢忠, 马凯, 陈建国, 邱芹军, 李虎, 潘声勇, 陶留锋. 2023. 结合BERT与BiGRU-Attention-CRF模型的地质命名实体识别. 地质通报, 42(5): 846-855. doi: 10.12097/j.issn.1671-2552.2023.05.014
作者姓名:谢雪景  谢忠  马凯  陈建国  邱芹军  李虎  潘声勇  陶留锋
作者单位:1.国家信息系统工程技术研究中心, 湖北 武汉 430074; 2.中国地质大学(武汉)计算机学院, 湖北 武汉 430074; 3.三峡大学计算机与信息学院, 湖北 宜昌 443002; 4.中国地质大学(武汉)资源学院, 湖北 武汉 430074; 5.济南轨道交通集团有限公司, 山东 济南 250000; 6.武汉中地数码科技有限公司, 湖北 武汉 430074
基金项目:国家自然科学基金项目《地球科学知识图谱表示模式与群智协同构建》(批准号: 42050101)、湖北省自然科学基金项目《复杂地质实体及其关系精准抽取方法研究》(编号: 2022CFB640)和山东省重大科技创新工程项目《数字孪生城市四维可视化信息系统及其在济南城区的应用》(编号: 2019JZZY020105)
摘    要:
从地质文本中提取地质命名实体, 对地质大数据的深度挖掘与应用具有重要意义。定义了地质命名实体的概念并制订了标注规范, 设计了地质实体对象化表达模型。地质文本存在大量长实体、复杂嵌套实体, 增加了地质命名实体识别的挑战性。
针对上述问题, ①引入BERT模型生成顾及上下文信息的高质量词向量表征; ②采用双向门控循环单元-注意力机制-条件随机场(BiGRU-Attention-CRF)对前一层输出的语义编码进行序列标注与解码。通过与主流深度学习模型进行对比, 该模型的F1值为84.02%, 均比其他模型表现出更优异的性能, 能在小规模地质语料库上有较好的识别效果。


关 键 词:命名实体识别   地质命名实体   BERT   注意力机制   BiGRU
收稿时间:2021-03-30
修稿时间:2021-06-10
点击此处可从《地质通报》浏览原始摘要信息
点击此处可从《地质通报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号