首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
对来源不同的地质对象进行关联匹配,并通过模型对其结构、属性及语义关系进行表示是后期语义查询及聚类等任务的重要支撑。文章针对地质调查空间实体与外部文本描述语义异构、表达差异等问题,提出了一种基于注意力机制的孪生网络地质调查空间实体与文本描述信息关联匹配模型。首先,将地质调查空间实体的属性信息转换成为文本段落,以句向量基本粒度对地质空间实体进行文本语义编码;接着将两类文本对象映射到统一向量空间中,并输入到孪生网络中进行特征学习,最后在构建真实数据集上进行模型性能的实验测评。结果显示,该模型能够较好表示地质调查空间实体句子语义信息,其识别F1值相比基准实验提高了8.4个百分点,优于选取的对比方法。  相似文献   

2.
邱芹军  段雨希  田苗  吴麒瑞  马凯  陶留锋  谢忠 《地质论评》2024,70(2):2024020022-2024020022
地质图件及其附属资源(如描述文本)作为地质知识的重要存储媒介,蕴含着大量的地学知识及专家经验知识及隐式知识。快速精准地对多模态地质数据进行知识规范化定义、形式化表达、语义化关联和精准化推理是目前地学知识抽取及挖掘的前沿。当前,海量的地学数据中图件及附属描述信息知识分布零散,图件中的信息无法有效地与描述信息进行关联并提供知识服务。本文以多模态地质数据为数据源,建立了多源数据驱动下的地质图知识表达模型,通过地质基础知识、规则知识及决策知识来表达图件中蕴含的显隐式地质知识,从语义、空间、属性三个维度表示地质对象间的关系;并基于领域知识针对地质图件及描述信息开展了地质实体及关系的精准抽取及存储研究,最后以江西省于都县银坑幅G50E011007图幅150000矿产地质调查矢量数据为例进行了验证与分析,实验结果验证了本文所提出的知识表达模型及知识抽取方法, 能够较好地解决地质知识建模中图文关联弱、知识挖掘不充分等问题。  相似文献   

3.
实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

4.
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

5.
邱芹军  田苗  马凯  谢忠  金相国  段雨希  陶留锋 《地质论评》2023,69(1):2023010005-2023010005
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。本文在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

6.
将具有多元异构性和复杂语义的矿床数据转化为结构化数据,是目前矿产资源勘查大数据领域面临的关键问题。传统的机器学习方法无法精确描述实体概念、属性及其属性值的语义信息,导致多源异构数据的可解释性较差。因此,可解释性的知识图谱已成为当前研究的热点。然而,当前矿床领域本体构建研究仍相对匮乏,这阻碍了矿床知识图谱的研究。本文聚焦于矿床领域的概念、关系、属性描述,结合知识工程、叙词表、复用前人本体及专家知识,采用基于知识工程和基于顶层本体相结合的本体构建方法,使用本体开发工具Protégé构建了以时空矿床文本为基础的矿床领域本体库,实现了矿床知识概念、关系的系统化、规范化、形式化表达。然后运用Neo4j构建本体库知识图谱,并以庞西垌多金属矿床为案例,将矿床本体与矿床数据进行了知识图谱连接,展示了矿床本体作为知识图谱骨架的重要性。本文研究对下一步矿床知识图谱推理分析具有一定的指导意义。  相似文献   

7.
大数据科学研究范式是大数据时代的必然结果。在大数据时代,地质学研究正面临着前所未有的挑战与机遇,亟需地质大数据分析的基础支撑。本文介绍若干种有价值的地质大数据分析工具及其应用。知识图谱以其强大的语义处理能力和开放组织能力,为大数据时代信息的知识化组织和智能应用提供了有效工具。它旨在描述真实世界中存在的各种实体或概念及其关系,构成一张巨大的语义网络图,以节点表示实体或概念,边则由属性或关系构成。机器学习与卷积神经网络模型仍然是当前地质大数据研究的热点。演化算法借鉴了自然界中生物进化与自适应过程的思想,是一种基于种群的元启发式最优化算法。它具有无需先验知识、能在全局范围内进行隐并行搜索的优点,可以用来精确地获取大数据中隐含的演化趋势与时空特征。图形社区发现技术将网络划分为若干个内部节点相似社区,为分析和理解网络提供有力的技术支持。随着空间分辨率、时间分辨率和辐射分辨率不断提高,遥感技术已广泛成为地质数据获得的主要技术手段。遥感大数据的数据存取和智能处理是最重要的发展方向。这些地质大数据分析方法已有成功的应用案例,并将广泛用于各种地质研究,如城市土壤污染智能监测、模拟、管控与预警研究,得益于地质大数据研究支撑系统的恰当选择以及地质大数据技术的强力支持,建立了可解释的多源多层城市土壤污染知识图谱,源于多源异构大数据有效融合的主要障碍正在去除。  相似文献   

8.
铀资源评价信息系统是铀资源评价的计算机系统,它包括以下几部分铀资源评价方法;铀矿专家知识库;地质、铀矿床数据库;铀资源评价程序等.铀资源评价方法主要介绍了4种即成矿成功树法;矿床规模频率法;铀勘查者矿产咨询系统;多元统计法.着重研究了"成功树"法.铀矿专家知识库是铀资源评价重要的组成部分,它是对专家经验的总结;地质、铀矿库数据库是对基础地质和铀矿地质信息的汇总,为铀矿评价提供了大量的实际资料;矿产资源评价程序系统是铀资源评价方法的具体应用,是本系统的核心.  相似文献   

9.
我国铀资源潜力概略分析与铀矿地质勘查战略   总被引:12,自引:0,他引:12  
张金带 《铀矿地质》2004,20(5):260-265
本文通过对我国铀矿地质工作程度和铀资源潜力的概略分析 ,提出铀矿地质勘查的战略是 :政府应对铀矿地质勘查进行长远规划 ,坚持“立足国内、增加储备”的基本方针 (“增加储备”应包括积极利用国外铀资源 ) ,以“主攻地浸砂岩型铀矿与积极探索其它经济型铀矿相结合”为基本勘查战略 ,以新的成矿地质理论体系为指导 ,运用先进的勘查方法技术体系、GIS预测方法体系和数字化地质图件系列进行铀矿地质勘查为基本技术思路 ,加快摸清和查明我国潜在铀矿资源 ,为核工业发展提供有力的资源保障  相似文献   

10.
"十五"期间铀矿地质勘查主要成果及"十一五"的总体思路   总被引:8,自引:0,他引:8  
“十五”期间,随着国家核电发展目标的明确,铀资源不断得到中央和国家有关部门的高度关注和重视,铀矿地质勘查工作得到进一步加强。5年来,我国北方中新生代盆地的铀矿勘查、区域预测评价及铀成矿理论和勘查方法研究等都取得了较快的进展和重要的成果。可地浸砂岩型铀矿勘查理论和方法技术的提升,大大提高了铀资源勘查效率,促进了我国铀矿勘查的可持续发展。文章最后还简要阐述了“十一五”铀矿地质勘查部署的总体思路。  相似文献   

11.
杨辰  毕奔腾  周立新 《中国岩溶》2021,40(3):548-554
岩溶领域通过地质调查和科学研究积累了大量的成果资源,资源之间的关联关系更加复杂,传统的关键词检索模式已不满足用户获取知识的需求。为实现知识层面的数据检索,利用数据挖掘技术进行岩溶实体抽取与关系计算,以岩溶术语为核心,基于知识图谱构建岩溶知识发现系统,实现岩溶地质成果、期刊、论文、图书、标准、项目、专家等实体的智能语义搜索和关联导航,最大化的挖掘数据的潜在价值,为用户提供精准知识服务,提升了用户体验。   相似文献   

12.
仉宝聚 《铀矿地质》2007,23(6):F0004-F0004
惊悉涂光炽院士逝世的消息,铀矿地质系统全体同仁无不表示沉痛的哀悼和深切的怀念。涂光炽院士是中国科学院地球化学研究所的资深专家,他不仅在地球化学和矿床学领域具有很高的造诣,还积极推动我国铀矿地质事业的进展。在铀资源勘查的不同阶段,他研究铀矿床成矿规律,为铀资源勘查工作出谋献策,足迹踏遍祖国大江南北。例如,在连山关铀矿床研究、华北地台铀资源开发、不整合面类型铀矿床的目标类型选择,以及相山铀矿田研究等方面均提出了真知灼见。涂光炽院士以他广博的学识,多次在铀资源研讨及学术交流中,开拓新思路、探讨新命题,为我国铀矿…  相似文献   

13.
开展三维地质建模的目标,不应当只是实现地质体框架的可视化表达,而应当同时实现地质大数据的聚合、管理、挖掘、分析和共享。然而,传统的方法和技术难以实现顾及地质语义的结构-属性一体化三维地质建模与耦合表达。多点地质统计学方法虽然便于多源数据、地质先验知识、结构-属性的融合建模,却仍然受到数据结构表达能力不足、三维训练图像难以获取和非平稳现象的限制。面向地质大数据集成与管理的要求,详细讨论了三维地质建模中的空间数据模型、基于多点地质统计学的结构-属性一体化集成建模方法、以及基于三维地质模型的地质大数据集成与管理的框架与模式。发展新型的面向地质结构-属性耦合表达的统一空间数据模型,以及知识驱动与数据驱动协同的三维地质结构-属性一体化集成建模技术体系,着力构建出地质大数据的聚合、集成、管理、挖掘和分析的可视化环境与操作平台,是未来三维地质建模领域的研究热点和前沿方向。  相似文献   

14.
陈忠良  袁峰  李晓晖  张明明 《地质论评》2022,68(1):2022010001-2022010001
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。  相似文献   

15.
针对传统地质资料服务方式单一、数据共享困难等问题,提出了地质资料管理的转型方案.对面向知识服务的地质资料知识组织方式、知识检索以及知识管理理念如何指导地质资料服务等方面进行了探讨.以地质数据本体构建、基于关联数据技术的地质资料语义化组织以及基于地质大数据的知识检索模型搭建为转型手段,介绍了促进地质资料转型升级的语义化描述及数据关联技术,以期对地质资料管理转型起到参考作用.  相似文献   

16.
“煤铀兼探”“油铀兼探”是当今的研究热点,利用煤、油气田钻井的测井资料评价铀资源潜力是尚待解决的难题。以鄂尔多斯盆地彭阳铀矿区为例,开展基于自然伽马测井数据的铀资源评价方法探索。根据彭阳铀矿区砂岩型铀储层自然伽马异常响应显著的特性,通过对比分析9个验证孔中定量伽马和油田钻孔中自然伽马测井数据,研究彭阳铀矿区矿层定量伽马值的自然伽马测井回归模型,研发矿层平米铀量筛选计算程序。初步建立基于自然伽马测井信息的区域铀矿层识别和品位评价方法,研究成果精度与实测数据吻合,解决了难以高效利用常规煤、油气田测井资料进行铀矿层识别和品位评价的问题。该成果可为鄂尔多斯盆地铀资源调查和潜力评价提供有效的技术支持。   相似文献   

17.
关于当前铀矿地质工作的几点思考   总被引:9,自引:2,他引:7  
张金带 《铀矿地质》2003,19(6):321-325
本根据我国能源发展对铀资源的需求形势,在铀矿勘查战略、重点地区铀矿勘查、铀资源潜力评价、铀矿地质科研等方面作了思考,提出工作建议,并强调了以人为本的管理理念。  相似文献   

18.
层次分析法主要用于一些较为复杂、模糊且难以完全定量分析的问题的定量化决策。在地质勘查特别是铀矿地质勘查领域,高分(包括高空间分辨率和高光谱分辨率)遥感和伽马能谱数据异常信息与成矿要素及成矿可能性之间的关系难以定量化描述。在大面积研究区中,通过高分数据、伽马能谱数据及其他地学数据,该方法能够定量化地描述最有潜力的铀成矿远景区。文章分析了高分遥感和伽马能谱等多源数据异常信息与铀成矿要素的对应关系,探讨了铀成矿要素转化为层次分析法准则层的适用性和最优远景区选择规则的合理性,研究层次分析法应用于高分遥感和伽马能谱等多源数据铀矿勘查定量化分析的可行性和适用性,并以本巴图地区为实例进行该方法的操作步骤的展示和验证。研究结果表明,层次分析法适用于多源数据铀矿远景区筛选工作,且效果良好。  相似文献   

19.
伊犁盆地南缘砂岩型铀矿成矿潜力综合评价研究   总被引:2,自引:0,他引:2  
我国矿产资源勘查已经积累了大量地质资料,在新的成矿理论指导下,如何使这些资料在新一轮铀资源勘查中发挥最大效能是一项重要课题.本文提出了砂岩型铀矿综合找矿模型的构建流程.在研究伊犁盆地南缘512铀矿床的地质、水文地质及区域地球物理场特征的基础上,建立了512铀矿床的多源信息描述模型,从中归纳总结出512式砂岩型铀矿田和铀矿床的综合找矿模型;依据综合找矿模型,完成了研究区砂岩型铀矿成矿信息的提取.最后,应用证据权重法综合中比例尺多源成矿信息完成了伊犁盆地南缘砂岩型铀矿成矿潜力综合定量评价,取得了较好的预测效果.  相似文献   

20.
大数据为地球科学研究带来了新的思路和挑战。但由于存在描述规范不统一、共享机制不明、语义异构等问题,在数据集成、共享与复用等方面存在较大困难,使得大数据的众多优势在地球科学相关研究中难以充分发挥。知识图谱能够准确、清晰地表达概念及其相互之间的复杂语义关系,为机器所理解,是实现语义翻译、数据融合和复用的关键技术。文章对地球科学知识图谱的内涵和特点进行了深入的分析,归纳了地球科学知识图谱的主要构建方法,梳理了数据字典、知识体系和知识图谱之间的关系,对与地球科学知识图谱构建相关的专题数据库和领域本体的建设现状进行了回顾,指出了地球科学知识图谱构建中存在的主要问题,并阐述了地球科学知识图谱的应用前景,以期推动和完善地球科学知识图谱的建设和应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号