首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
邱芹军  田苗  马凯  谢忠  金相国  段雨希  陶留锋 《地质论评》2023,69(1):2023010005-2023010005
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。本文在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

2.
陈忠良  袁峰  李晓晖  张明明 《地质论评》2022,68(1):2022010001-2022010001
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。  相似文献   

3.
地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。  相似文献   

4.
地质调查正在从"数字化"走向"智能化",需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取.地学命名实体和关系联合提取是当前研究的难点和核心.本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取.首先,通过收集数字地质填图工作中的剖面测量...  相似文献   

5.
邱芹军  段雨希  田苗  吴麒瑞  马凯  陶留锋  谢忠 《地质论评》2024,70(2):2024020022-2024020022
地质图件及其附属资源(如描述文本)作为地质知识的重要存储媒介,蕴含着大量的地学知识及专家经验知识及隐式知识。快速精准地对多模态地质数据进行知识规范化定义、形式化表达、语义化关联和精准化推理是目前地学知识抽取及挖掘的前沿。当前,海量的地学数据中图件及附属描述信息知识分布零散,图件中的信息无法有效地与描述信息进行关联并提供知识服务。本文以多模态地质数据为数据源,建立了多源数据驱动下的地质图知识表达模型,通过地质基础知识、规则知识及决策知识来表达图件中蕴含的显隐式地质知识,从语义、空间、属性三个维度表示地质对象间的关系;并基于领域知识针对地质图件及描述信息开展了地质实体及关系的精准抽取及存储研究,最后以江西省于都县银坑幅G50E011007图幅150000矿产地质调查矢量数据为例进行了验证与分析,实验结果验证了本文所提出的知识表达模型及知识抽取方法, 能够较好地解决地质知识建模中图文关联弱、知识挖掘不充分等问题。  相似文献   

6.
杨辰  毕奔腾  周立新 《中国岩溶》2021,40(3):548-554
岩溶领域通过地质调查和科学研究积累了大量的成果资源,资源之间的关联关系更加复杂,传统的关键词检索模式已不满足用户获取知识的需求。为实现知识层面的数据检索,利用数据挖掘技术进行岩溶实体抽取与关系计算,以岩溶术语为核心,基于知识图谱构建岩溶知识发现系统,实现岩溶地质成果、期刊、论文、图书、标准、项目、专家等实体的智能语义搜索和关联导航,最大化的挖掘数据的潜在价值,为用户提供精准知识服务,提升了用户体验。   相似文献   

7.
金矿实体关系的智能识别是提高金矿文献分析挖掘和知识提取的重要方法和途径。此次研究针对目前金矿实体关系抽取涉及到的核心问题,如金矿实体关系复杂、人工标注信息少等特点,提出了基于BERT(Bidirectional Encoder Representations from Transformer)的远程监督关系抽取模型。并通过金矿地质数据编码、金矿分类和金矿地质实体过滤等模块的优化改进,提高了金矿地质实体关系抽取的准确率。最后通过对金矿文献数据的实体关系抽取实验,验证了该方法的有效性。   相似文献   

8.
基于深度信念网络的地质实体识别方法   总被引:1,自引:1,他引:1  
张雪英  叶鹏  王曙  杜咪 《岩石学报》2018,34(2):343-351
地质实体作为地质信息表达的核心要素,对其准确识别是地质文本数据挖掘和应用的重要基础。本文通过分析各种类型文本数据中地质实体信息的描述特点,构建了地质实体信息的标注规范和语料库,设计了基于深度信念网络(Deep Belief Networks)的地质实体识别模型,解决了文本数据中地质实体信息的结构化、规范化处理问题。以矿产资源地质调查报告为实验数据,对本文的地质实体识别方法性能进行了评估分析。结果表明,深度学习模型能够在较小规模语料库的基础上,达到较好的地质实体识别性能。  相似文献   

9.
邱芹军  吴亮  马凯  谢忠  陶留锋 《地球科学》2023,(5):1875-1891
知识图谱是形式化描述实体及其相互关系的知识系统,其在应急救灾、时空预测决策等方面发挥着重要的作用.灾害应急领域面临数据骤增而应急关键知识匮乏问题,由此从灾害链角度分析地质灾害发展过程中关联的诸多要素,提出了一种自顶向下和自底向上结合的地质灾害链知识图谱构建方法 .首先,基于灾害链角度对地质灾害间复杂形成机理及成链规律进行分析,在已有地质灾害知识基础上,基于自顶向下方法建立了统一的用于信息抽取的地质灾害链本体语义表达框架,包括描述地质灾害知识体系的地质灾害事件本体、承载地质灾害发生的地质环境本体、受地质灾害作用下的地理对象本体及地质灾害在灾前、灾中和灾后时空过程中对应的应急处置方法本体;其次,结合自底向上方法构建数据层,通过知识融合、知识存储对概念、实例与属性等要素及其关联关系进行识别;最后以汶川地震为例并对知识图谱进行可视化表达.结果表明,本方法能有效地对四类要素及其关系进行识别,实现了数据-信息-知识的转换,为地质灾害领域的知识图谱构建提供技术参考.  相似文献   

10.
实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

11.
Lithostratigraphy, physicochemical stratigraphy, biostratigraphy, and geochronology of the 77–70 Ma old series bracketing the Campanian–Maastrichtian boundary have been investigated by 70 experts. For the first time, direct relationships between macro- and microfossils have been established, as well as direct and indirect relationships between chemo-physical and biostratigraphical tools. A combination of criteria for selecting the boundary level, duration estimates, uncertainties on durations and on the location of biohorizons have been considered; new chronostratigraphic units are proposed. The geological site at Tercis is accepted by the Commission on Stratigraphy as the international reference for the stratigraphy of the studied interval. To cite this article: G.S. Odin, C. R. Geoscience 334 (2002) 409–414.  相似文献   

12.
Some olistolites reworked in a Tertiary flysch of Mount Parnon (Peloponnesus, Greece) exhibit a Late Permian assemblage, dominated by Paradunbarula (Shindella) shindensis, Hemigordiopsis cf. luquensis and Colaniella aff. minima. This association corresponds to the Late Wuchiapingian (=Late Dzhulfian), a substage whose algae and foraminifera are generally little known. Contemporaneous limestones crop out in the middle part of the Episkopi Formation in Hydra, but they are rather commonly reworked in Mesozoic and Cainozoic sequences. The palaeobiogeographical affinities shared by the foraminiferal markers of Greece, southeastern Pamir, and southern China, are very strong (up to the specific level), and are congruent with the Pangea B reconstructions. To cite this article: E. Skourtsos et al., C. R. Geoscience 334 (2002) 925–931.  相似文献   

13.
PALEONTOLOGY     
正20141596 Liu Yunhuan(School of Earth Sciences and Resources,Chang’an University,Xi’an 710054,China);Shao Tiequan Early Cambrian Quadrapyrgites Fossils of Xixiang Boita in Southern Shaanxi Province(Journal of Earth Sciences and Environment,ISSN1672-6561,CN61-1423/P,35(3),2013,p.39-43,3 illus.,20 refs.)  相似文献   

14.
正20141719 Chen Zhijun(State Key Laboratory of Geological Processes and Mineral Resources,China University of Geosciences,Wuhan 430074,China);Chen Jianguo Automated Batch Mapping Solution for Serial Maps:A Case Study of Exploration Geochemistry Maps(Journal of Geology,ISSN1674-3636,CN32-1796/P,37(3),2013,p.456-464,2 illus.,2 tables,10 refs.)  相似文献   

15.
正20140962 Chen Fenning(Xi’an Institute of Geology and Mineral Resources,Xi’an710054,China);Chen Ruiming Late Miocene-Early Pleistocene Ostracoda Fauna of Gyirong Basin,Southern Tibet(Acta Geologica Sinica,ISSN0001-5717,CN11-1951/P,87(6),2013,p.872-886,6illus.,56refs.)  相似文献   

16.
PETROLOGY     
正1.IGNEOUS PETROLOGY20142008Cai Jinhui(Wuhan Center,China Geological Survey,Wuhan 430205,China);Liu Wei Zircon U-Pb Geochronology and Mineralization Significance of Granodiorites from Fuzichong Pb-Zn Deposit,Guangxi,South China(Geology and Mineral Resources of South China,ISSN1007-3701,CN42-1417/P,29(4),2013,p.271-281,7illus.,  相似文献   

17.
正20141205Cheng Weiming(State Key Laboratory of Resources and Environmental Information System,Institute of Geographic Sciences and Natural Resources Research,CAS,Beijing 100101,China);Xia Yao Regional Hazard Assessment of Disaster Environment for Debris Flows:Taking Jundu Mountain,Beijing as an  相似文献   

18.
正20141266Fan Chaoyan(Guangdong Provincial Key Laboratory of Mineral Resources and Geological Processes,Guangzhou 510275,China);Wang Zhenghai On Error Analysis and Correction Method of Measured Strata Section with Wire Projection Method(Journal of  相似文献   

19.
正20140582 Fang Xisheng(Key Lab.of Marine Sedimentology and Environmental Geology,First Institute of Oceanography,State Oceanic Administration,Qingdao 266061,China);Shi Xuefa Mineralogy of Surface Sediment in the Eastern Area off the Ryukyu Islands and Its Geological Significance(Marine Geology Quaternary Geology,ISSN0256-1492,CN37  相似文献   

20.
正20141810 Bian Yumei(Geological Environmental Monitoring Center of Liaoning Province,Shenyang 110032,China);Zhang Jing Zoning Haicheng,Liaoning Province,by GeoHazard Risk and Geo-Hazard Assessment(Journal of Geological Hazards and Environment Preservation,ISSN1006-4362,CN51-1467/P,24(3),2013,p.5-9,2 illus.,tables,refs.)  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号