首页 | 本学科首页   官方微博 | 高级检索  
     检索      

地质领域文本实体关系联合抽取方法
引用本文:邱芹军,王斌,徐德馨,马凯,谢忠,潘声勇,陶留锋.地质领域文本实体关系联合抽取方法[J].高校地质学报,2023(3):419-428.
作者姓名:邱芹军  王斌  徐德馨  马凯  谢忠  潘声勇  陶留锋
作者单位:1. 中国地质大学(武汉)计算机学院;2. 智能地学信息处理湖北省重点实验室;3. 武汉市测绘研究院;4. 三峡大学计算机与信息学院;5. 湖北省水电工程智能视觉监测重点实验室;6. 武汉中地数码科技有限公司
摘    要:地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。

关 键 词:地质领域  实体关系联合抽取  知识图谱  BERT  BiGRU
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号