首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。  相似文献   

2.
实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

3.
章文琦  刘远刚  李少华  于金彪  史敬华  张昌民 《地质论评》2024,70(3):2024030034-2024030034
地质命名实体识别是识别地质文本中的地质实体并分类到准确的地质概念中的一项地质知识智能抽取任务,也是构建地质领域知识图谱的关键技术之一。本研究针对地质命名实体识别领域中复杂实体识别精度不足和样本标注成本较高这两大挑战,构建了一种地质实体识别模型BERTwwm-BiLSTM-Attention-CRF,该模型通过改进的预训练层BERTwwm并在模型中加入Self-Attention模块,显著提升了复杂地质实体的识别精度,对地质实体识别的精度达到92.67%的精确率,94.21%的召回率,以及93.29%的F1值。同时,为降低标注成本,提升小规模数据集的识别精度,本研究优化了模型构建流程,采用模型辅助标注方法,加快数据集的标注速度;改进简单数据增强方法,并利用地质字典有效扩充数据集,降低了人工标注的难度。经过实验证明,本研究提出的改进方法提高了地质实体识别效果,为地质文本分析提供了一种高效且经济的解决方案,有助于推动地质领域知识图谱的构建和地质信息的智能化处理。  相似文献   

4.
储德平  万波  李红  方芳  王润 《地球科学》2021,46(8):3039-3048
地质实体是地质文本中的关键和核心信息,对其准确识别是地质信息提取和挖掘的重要前提.设计了ELMO-CNN-BiLSTM-CRF模型,基于预训练字向量构建深层BiLSTM-CRF神经网络模型,通过添加词语动态特征以及词语字符级别的特征,弥补字向量特异性缺失的问题,提高对于地质文本中复杂多词义的识别水平和对地质实体局部特征的提取能力.以《西藏自治区谢通门县雄村铜矿勘探地质报告》为例,对该模型的性能进行了评估,模型的准确率、召回率和F1值分别为95.15%、95.26%和95.21%.实验表明相比BiLSTM-CRF和CNN-BiLSTM-CRF模型,该模型在小规模语料地质实体识别方面效果更优,且能够有效识别长地质实体词汇和地质多义词.   相似文献   

5.
对来源不同的地质对象进行关联匹配,并通过模型对其结构、属性及语义关系进行表示是后期语义查询及聚类等任务的重要支撑。文章针对地质调查空间实体与外部文本描述语义异构、表达差异等问题,提出了一种基于注意力机制的孪生网络地质调查空间实体与文本描述信息关联匹配模型。首先,将地质调查空间实体的属性信息转换成为文本段落,以句向量基本粒度对地质空间实体进行文本语义编码;接着将两类文本对象映射到统一向量空间中,并输入到孪生网络中进行特征学习,最后在构建真实数据集上进行模型性能的实验测评。结果显示,该模型能够较好表示地质调查空间实体句子语义信息,其识别F1值相比基准实验提高了8.4个百分点,优于选取的对比方法。  相似文献   

6.
邱芹军  田苗  马凯  谢忠  金相国  段雨希  陶留锋 《地质论评》2023,69(1):2023010005-2023010005
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。本文在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

7.
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

8.
陈忠良  袁峰  李晓晖  张明明 《地质论评》2022,68(1):2022010001-2022010001
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。  相似文献   

9.
地质资料是重要的信息资源,需要深度挖掘其服务价值,以大数据、网络化为依托,完善地质信息产品体系和智能服务体系,对推动实体经济和数字经济融合发展,推动互联网、大数据、人工智能同实体经济深度融合具有重要意义。因此,本文总结了陕西地质资料智能服务系统建设的初步成果,在数据深度加工的基础上,根据用户搜索,帮助用户进行信息分析、重组及机构化呈现,并在信息阅读环节提供多源内容关联、内容辅助阅读和数据结构化服务。未来在大数据环境下地质资料智能服务需要与更加具体的地质资料应用环境相结合,最大化的体现地质资料的价值。  相似文献   

10.
时间信息贯穿于地质现象和事件产生、发展、消亡的整个过程中,反映了地质现象和事件的状态和演变过程.特别是,地质时间表达通常与成矿内在机制和时空演化规律有关.设计并实现了基于深度学习的通用时间和地质时间信息抽取方法.结合地质矿产文本中时间信息的描述特点,将时间信息划分为通用时间信息与地质时间信息两种类型,并对两种时间信息类型进行细分;基于自主研发的“交互式矿产信息标注软件”,采用交叉验证及意见反馈模式构建了地质时间信息语料库;实现了基于双向长短期记忆神经网络—条件随机场(BiLSTM-CRF)的时间信息抽取方法;并与主流的卷积神经网络(CNN)和条件随机场(CRF)模型的抽取结果进行了比较.实验结果表明,基于双向长短期记忆神经网络—条件随机场的时间信息抽取效果最好,对总体时间抽取的F1值达到95.49%,较好地解决了地质文本中时间信息的规范化表达和结构化抽取问题.  相似文献   

11.
自Hinton等使用基于卷积神经网络的深度学习模型赢得Image Net分类比赛以来,深度学习的研究席卷了各个行业。通过介绍深度学习的历史,探索国内地质行业中深度学习模型的使用情况,并介绍深度学习的基础概念(如神经元、神经网络、监督学习和无监督学习等)以及深度学习基础模型中的2个重要网络:深度信念网络(DBN)和卷积神经网络(CNN)。在此基础上,类比深度学习在医学等相关领域的应用,提出了深度学习在地质上的几点应用:利用深度学习在计算机视觉上表现出的强大能力,可以对遥感图像进行聚类、对岩石样品图像进行分类、对岩石薄片数据进行描述;利用深度学习对原始数据表现出的强大识别能力,处理地质异常数据,从而确定成矿靶区的可能位置;利用深度学习的特点,对地震前的声信号数据进行处理,从而判断出地震发生前的剩余时间。  相似文献   

12.
金矿实体关系的智能识别是提高金矿文献分析挖掘和知识提取的重要方法和途径.此次研究针对目前金矿实体关系抽取涉及到的核心问题,如金矿实体关系复杂、 人工标注信息少等特点,提出了基于BERT(Bidirectional Encoder Representations from Transformer)的远程监督关系抽取模型....  相似文献   

13.
基于线框架模型的三维复杂地质体建模方法   总被引:1,自引:0,他引:1  
提出了一种基于线框架模型的复杂地质体三维建模方法,在准确表达复杂地质体各要素空间几何形态与相互关系的基础上,实现地层交错情况下断层面、地层面模型及复杂地质体模型的准确快速构建.建模实践表明:基于线框架模型的复杂地质体三维建模方法是准确高效的,能适应常见复杂地质条件下三维复杂地质体模型的构建.  相似文献   

14.
面向野外地质填图的空间实体对象表达   总被引:2,自引:6,他引:2  
开展以计算机技术为核心的辅助地质填图野外数据采集,必须以野外地质空间实体数据的采集为主线研制地质填图野外数据采集系统,运用软件工程学和系统工程学的方法,把面向对象软件工程开发技术与实际野外地质填图流程相结合运用到系统开发的各个环节,研究面向野外地质填图空间实体的分析方法和面向野外空间实体的数据对象的分析模型,建立了野外地质空间实体E-C-R模型,类层次结构及信息结构模型,为系统实现及系统集成提供了可行的技术开发路线。  相似文献   

15.
The metallogenic mapping program of the Geological Survey, Department of Mines, New South Wales has two aims, to provide an inventory of information on all known mineral deposits in New South Wales, and to enable the recognition and delineation of metallogenic districts and provinces.

Each deposit is described on a standardized data sheet. Selected information is symbolized on a coloured geological or tectonic background map at a scale of 1:250 000. This scale is considered to be suitable for locating deposits in the field and at the same time gives an impression of the regional distribution of deposits. The tectonic map is constructed using a plate tectonic model.

Each map is accompanied by interpretative notes which are not of standard form but in which one of three approaches may be adopted: an interpretation according to the geological association, the delineating of groupings of deposits in structural zones, and the recognition of metallogenic units based on a plate tectonic model. In many, but not all cases, mineral districts were first delineated before the above approaches were adopted.

The New South Wales Geological Survey's metallogenic maps may be used to develop concepts in ore genesis, and prognostic concepts for exploration. They assist in understanding the relationships between tectonic process and the concentration of ore minerals. They are valuable in land use and resource management studies.  相似文献   

16.
饶杨安  贺怀建 《岩土力学》2010,31(5):1621-1626
结合地质实体概念厘清数据类型及其特征对地层信息系统的发展有重要意义。地层信息系统数据可以归类为属性数据、几何数据、关系数据、元数据4类,地层信息中的地质实体可分为基础地质实体和地质实体要素,进一步把地质实体要素分为关联要素和非关联要素。文中分析了矿体、风化分界面、断层、褶皱、不整合面、滑坡体的几何属性。区分观测者位置、数据采集点和数据本身空间属性,数据获取方法可分为地表调查、钻入调查、岩层透视调查、岩层非透视调查,并分析了原始数据与地质实体的对应关系。  相似文献   

17.
基于空间数据和专家知识驱动的地质编图技术研究与应用   总被引:1,自引:0,他引:1  
地质图编制专业性强、工作量大,编图环节繁琐,而人工智能、大数据等新一代信息技术的快速发展,为中国地质图的编图技术发展提供了支撑。在地质大数据环境下,提出基于地质知识驱动的地质编图技术,通过构建地质编图时空综合模型和地质代号智能识别模型,可以对多图幅的沉积岩、侵入岩、火山岩、变质岩、构造等地质要素进行人机交互式、自动化、智能化地图元综合、断层简化、线形圆滑、图幅接边等。近年来,基于该技术在青海东部地区、河南洛阳、郑州地区及京津冀多地区开展的编图实践表明,该编图技术能够显著提高地质编图工作效率,具有实际应用意义。  相似文献   

18.
郑坤  毛维辰  严哲  张红萍 《岩土力学》2013,34(2):546-550
为了使复杂地质体建模过程趋向于自动化、简单化,在分析了复杂层状地质体的空间信息特征的基础上,提出了一种针对含断层的层状地质体的自动构建方法。该方法先对地质钻孔资料、地质报告图进行预处理,从而获得离散的数据点;然后选择基于表面模型的建模方法,根据从钻孔分层信息到剖面图再到地层面的建模流程,分别构建出地质体的顶、底两个地层表面模型;根据空间拓扑关系处理断层结构,将断层以两条首尾相连的约束线嵌入地面模型中;最后使用轮廓线拼接法生成侧面,将顶、底、侧面缝合成封闭的三维地层体模型。利用自主开发的三维可视化系统对该方法进行验证实现,并成功应用于山西省某煤田矿区的三维地质建模中,实践表明,该建模方法高效快速,自动化程度高,所构建的地质体模型表达复杂地质结构的效果良好。  相似文献   

19.
一种可存储路径的三维非均质空间最短距离场生成算法   总被引:1,自引:0,他引:1  
针对成矿定量预测强调三维空间信息综合研究的特殊需求和地质要素定量表达难、深层次信息挖掘难等关键问题,笔者提出了一种基于三维非均质地质空间的最短距离场算法,并且可回溯出目标体元到源体元的最短路径.应用该方法实现了对某铜矿区三维地质实体模型深层次和组合信息的挖掘,在反映断层对地质空间分划作用的基础上,建立了侵入岩体的最短距离场,可用于对侵入岩体热力场和围岩蚀变等问题的分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号