首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   10篇
  免费   0篇
  国内免费   4篇
测绘学   1篇
地质学   12篇
自然地理   1篇
  2024年   2篇
  2023年   10篇
  2022年   2篇
排序方式: 共有14条查询结果,搜索用时 15 毫秒
1.
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   
2.
地质报告中地质体的几何、拓扑及属性信息是三维地质建模过程中重要约束性信息。但传统的属性信息抽取方法存在覆盖率有限、局限于人工设计特征及模型泛化能力差等问题。面向三维建模任务,总结了地质报告中地质体的几何、拓扑及属性文本的特点,提出了一种基于BERT-BiLSTM-CRF的三维地质建模信息抽取方法;基于BERT预训练模型,构建融合BiLSTM和CRF的深度学习模型,通过BERT模型获取动态字符深层次语义信息,弥补静态词向量无法解决一词多义的问题,提高地质体复杂建模信息的抽取能力。以43篇地质报告为数据源进行模型性能评估,实验结果表明所提出的方法对于地质体三类属性信息抽取准确率达到90%以上,对于三维地质建模具有重要支撑作用。  相似文献   
3.
邱芹军  吴亮  马凯  谢忠  陶留锋 《地球科学》2023,(5):1875-1891
知识图谱是形式化描述实体及其相互关系的知识系统,其在应急救灾、时空预测决策等方面发挥着重要的作用.灾害应急领域面临数据骤增而应急关键知识匮乏问题,由此从灾害链角度分析地质灾害发展过程中关联的诸多要素,提出了一种自顶向下和自底向上结合的地质灾害链知识图谱构建方法 .首先,基于灾害链角度对地质灾害间复杂形成机理及成链规律进行分析,在已有地质灾害知识基础上,基于自顶向下方法建立了统一的用于信息抽取的地质灾害链本体语义表达框架,包括描述地质灾害知识体系的地质灾害事件本体、承载地质灾害发生的地质环境本体、受地质灾害作用下的地理对象本体及地质灾害在灾前、灾中和灾后时空过程中对应的应急处置方法本体;其次,结合自底向上方法构建数据层,通过知识融合、知识存储对概念、实例与属性等要素及其关联关系进行识别;最后以汶川地震为例并对知识图谱进行可视化表达.结果表明,本方法能有效地对四类要素及其关系进行识别,实现了数据-信息-知识的转换,为地质灾害领域的知识图谱构建提供技术参考.  相似文献   
4.

海量地质图件蕴含着丰富的地学基础知识及专家经验知识。地质图主要表达了通过区域地质调查、矿产地质调查所获取的地球表面的地质知识(如地层单元、岩体、断裂等)。如何快速地从矢量地质图件中抽取地质知识并形成知识服务是目前地学知识图谱及知识服务研究的前沿。由于传统的地质图知识抽取主要依赖人工方式进行综合分析,本文聚焦于矢量地质图件知识表达与抽取研究,提出了一种地质图知识表达框架,提取地质图中所包含的地质实体及关系,将地质图信息以知识图谱的形式表达,并开展了基于地质矢量知识图谱的智能问答应用。最后以江西省于都县银坑幅矢量数据集为例开展实验验证分析,结果表明,本文方法能够较为全面地获取地质图中各个地质对象的信息,提高了地质图语义表达的效果,同时也可以提高地质学习人员对地质图的理解和认识,让计算机能够大规模获取地质图的知识内容。

  相似文献   
5.
6.

矿产资源地质报告中蕴含大量专家经验及基础地质知识。快速准确地从海量矿产资源文本中抽取形成结构化知识已成为目前研究热点,命名实体识别是信息抽取与知识挖掘的重要步骤。针对矿产资源地质文本中存在实体长度长、专业术语多、实体嵌套等问题,已有基于深度学习的命名实体识别直接应用在矿产资源领域性能低下,本文提出了一种矿产资源命名实体识别深度学习模型:ALBERT(A Lite Bidirectional Encoder Representations fromTransformers) -BiLSTM(Bi-directional Long Short-Term Memory)-CRF(Conditional Random Field),通过ALBERT预训练语言模型获取地质文本丰富语义特征,同时结合汉字拼音、字形和词边界特征来共同作为嵌入层,从而提高对复杂实体的识别能力。本文方法在人民日报、电子简历数据集及构建的矿产资源数据集上进行实验,结果表明提出方法在准确率、召回率、F1值上分别达到70.97%、64.33%、67.49%。

  相似文献   
7.

地质表格信息提取是地质报告从信息转换到知识阶段的重要任务之一,对将非结构化的数据转化为结构化的地学知识具有重要意义,同时还为文本与表格的知识关联提供了技术支撑。然而现有的表格解析方法在地学领域存在局限性,在单元格提取中,地质表格中大量的合并单元格造成了不同单元格间大小差异大,大量小面积单元格无法被提取;在表格解析方面地质表格包含了大量的被斜线分割的特殊表头,难以自动化解析。为解决上述问题,本文提出了一种基于注意力机制的Mask RCNN单元格提取模型及基于OpenCV框架的表格结构解析方法。主要包括两个步骤:1)上下文注意模块(CAM)学习上下文特征以识别不同大小单元格;2)一种标准容错机制的复杂表头解析方法,解析含斜线分割的复杂表头单元格。在构建的地质表格数据集上进行模型性能评估,该方法对于多数地质表格的解析准确率达到95% 以上;相比其他单元格识别和表格结构解析方法,该方法解析效果更优。

  相似文献   
8.
从地质文本中提取地质命名实体, 对地质大数据的深度挖掘与应用具有重要意义。定义了地质命名实体的概念并制订了标注规范, 设计了地质实体对象化表达模型。地质文本存在大量长实体、复杂嵌套实体, 增加了地质命名实体识别的挑战性。针对上述问题, ①引入BERT模型生成顾及上下文信息的高质量词向量表征; ②采用双向门控循环单元-注意力机制-条件随机场(BiGRU-Attention-CRF)对前一层输出的语义编码进行序列标注与解码。通过与主流深度学习模型进行对比, 该模型的F1值为84.02%, 均比其他模型表现出更优异的性能, 能在小规模地质语料库上有较好的识别效果。  相似文献   
9.
杨盈  邱芹军  谢忠  田苗  郑诗语  郑帅 《测绘通报》2023,(8):155-160+177
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。  相似文献   
10.
邱芹军  段雨希  田苗  吴麒瑞  马凯  陶留锋  谢忠 《地质论评》2024,70(2):2024020022-2024020022
地质图件及其附属资源(如描述文本)作为地质知识的重要存储媒介,蕴含着大量的地学知识及专家经验知识及隐式知识。快速精准地对多模态地质数据进行知识规范化定义、形式化表达、语义化关联和精准化推理是目前地学知识抽取及挖掘的前沿。当前,海量的地学数据中图件及附属描述信息知识分布零散,图件中的信息无法有效地与描述信息进行关联并提供知识服务。本文以多模态地质数据为数据源,建立了多源数据驱动下的地质图知识表达模型,通过地质基础知识、规则知识及决策知识来表达图件中蕴含的显隐式地质知识,从语义、空间、属性三个维度表示地质对象间的关系;并基于领域知识针对地质图件及描述信息开展了地质实体及关系的精准抽取及存储研究,最后以江西省于都县银坑幅G50E011007图幅150000矿产地质调查矢量数据为例进行了验证与分析,实验结果验证了本文所提出的知识表达模型及知识抽取方法, 能够较好地解决地质知识建模中图文关联弱、知识挖掘不充分等问题。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号