共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
对来源不同的地质对象进行关联匹配,并通过模型对其结构、属性及语义关系进行表示是后期语义查询及聚类等任务的重要支撑。文章针对地质调查空间实体与外部文本描述语义异构、表达差异等问题,提出了一种基于注意力机制的孪生网络地质调查空间实体与文本描述信息关联匹配模型。首先,将地质调查空间实体的属性信息转换成为文本段落,以句向量基本粒度对地质空间实体进行文本语义编码;接着将两类文本对象映射到统一向量空间中,并输入到孪生网络中进行特征学习,最后在构建真实数据集上进行模型性能的实验测评。结果显示,该模型能够较好表示地质调查空间实体句子语义信息,其识别F1值相比基准实验提高了8.4个百分点,优于选取的对比方法。 相似文献
3.
4.
地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。 相似文献
5.
在当今信息社会,科学技术的发展日新月异,地质科学技术的发展也随着国民经济的发展和改革开放的进一步深入而突飞猛进,地质科学与其它科学相互渗透、交叉,而产生新的学科、新的分支,地质期刊的内容也随之而不断丰富和扩展。信息专家认为:谁有效地开发利用了信息资源,谁就能在激烈的竞争中迅速占领制高点。信息产业已成为发达国家国民经济的主导,而期刊信息是整个信息资源中极为重要的组成部分,它对一个国家的科学技术的进步,社会经济的发展以及人民生活水平的提高起着不可低估的作用。 相似文献
6.
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。 相似文献
7.
8.
基于深度信念网络的地质实体识别方法 总被引:1,自引:1,他引:1
地质实体作为地质信息表达的核心要素,对其准确识别是地质文本数据挖掘和应用的重要基础。本文通过分析各种类型文本数据中地质实体信息的描述特点,构建了地质实体信息的标注规范和语料库,设计了基于深度信念网络(Deep Belief Networks)的地质实体识别模型,解决了文本数据中地质实体信息的结构化、规范化处理问题。以矿产资源地质调查报告为实验数据,对本文的地质实体识别方法性能进行了评估分析。结果表明,深度学习模型能够在较小规模语料库的基础上,达到较好的地质实体识别性能。 相似文献
9.
10.
时间信息贯穿于地质现象和事件产生、发展、消亡的整个过程中,反映了地质现象和事件的状态和演变过程.特别是,地质时间表达通常与成矿内在机制和时空演化规律有关.设计并实现了基于深度学习的通用时间和地质时间信息抽取方法.结合地质矿产文本中时间信息的描述特点,将时间信息划分为通用时间信息与地质时间信息两种类型,并对两种时间信息类型进行细分;基于自主研发的“交互式矿产信息标注软件”,采用交叉验证及意见反馈模式构建了地质时间信息语料库;实现了基于双向长短期记忆神经网络—条件随机场(BiLSTM-CRF)的时间信息抽取方法;并与主流的卷积神经网络(CNN)和条件随机场(CRF)模型的抽取结果进行了比较.实验结果表明,基于双向长短期记忆神经网络—条件随机场的时间信息抽取效果最好,对总体时间抽取的F1值达到95.49%,较好地解决了地质文本中时间信息的规范化表达和结构化抽取问题. 相似文献
11.
主TIN模式下面向拓扑的三维地质块体构建方法 总被引:1,自引:0,他引:1
当前普遍采用主TIN模式对层状地质体进行三维结构建模,然而在地质块体的构建方面还有所欠缺。考虑到由于尖灭、出露等现象引起的各地质块体间空间位置关系的复杂性,根据主TIN建模的特点,处理完地层相交与高程调整之后,通过对地层面中某个区域内的三角网与上下地层中对应区域内的三角网的重叠次数的不同,设置子面类型标记,从而分离出一个地层面中不同类型的子面。依据子面的类型可以快速建立地质块体与被引用的各子面之间的对应关系,最终自动分离出地层中的各个地质块体,并保证相邻块体在邻接处有唯一的公共子面,由此可建立各地质块体间的空间拓扑关系。 相似文献
12.
从地质文本中提取地质命名实体, 对地质大数据的深度挖掘与应用具有重要意义。定义了地质命名实体的概念并制订了标注规范, 设计了地质实体对象化表达模型。地质文本存在大量长实体、复杂嵌套实体, 增加了地质命名实体识别的挑战性。针对上述问题, ①引入BERT模型生成顾及上下文信息的高质量词向量表征; ②采用双向门控循环单元-注意力机制-条件随机场(BiGRU-Attention-CRF)对前一层输出的语义编码进行序列标注与解码。通过与主流深度学习模型进行对比, 该模型的F1值为84.02%, 均比其他模型表现出更优异的性能, 能在小规模地质语料库上有较好的识别效果。 相似文献
13.
主要发达国家地质信息服务的政策体系及其特点 总被引:3,自引:0,他引:3
信息服务政策是信息服务顺利实施的保障。美、加、澳和英国等主要发达国家的地质调查机构制定并执行了一系列的信息服务政策。这些政策规定了服务的对象、内容、定价、合作伙伴关系、信息发布、客户关系、服务质量等方面的行为准则,涵盖了实施信息服务涉及的所有主要行为,已经形成了比较完整的体系。从以下几个方面阐述了上述主要发达国家信息服务政策体系的特点:信息自由法、版权对地质信息服务的影响,比较完善的定价政策、价格体系和重视用政策、标准规范信息服务。 相似文献
14.
据2008年12月北京大学出版社出版的《中文核心期刊要目总览》2008版(即第五版),由煤炭科学研究总院西安研究院主办的《煤田地质与勘探》被确定为矿业工程类的核心期刊。这是《煤田地质与勘探》自1992年在《中文核心期刊要目总览》中被确定为中文核心期刊以来,连续五次榜上有名。 相似文献
15.
16.
基于三维数字地质模型的地质空间剪切分析是"玻璃国土"建设所面临的关键技术之一。其难点包括复杂三维数据环境中的高效实体布尔运算方法,以及相关三维实体语义信息的实时查询处理。采用基于BSP树的多边形合并与分解技术,实现三维空间实体的布尔运算与矢量剪切;采用多线程实现不同要素集合的并行裁剪运算,并在三维空间数据库引擎的支持下,进一步提升地上地下一体化信息处理和语义查询效率。以武汉市规划信息系统为例,实现了地下硐室和隧道动态开挖过程的三维地质空间剪切分析,并结合水利水电工程地下厂房设计和矿山三维巷道设计实例,说明了基于三维数字地质模型的地质空间分析的综合应用效果。 相似文献
17.
基于空间数据和专家知识驱动的地质编图技术研究与应用 总被引:1,自引:0,他引:1
地质图编制专业性强、工作量大,编图环节繁琐,而人工智能、大数据等新一代信息技术的快速发展,为中国地质图的编图技术发展提供了支撑。在地质大数据环境下,提出基于地质知识驱动的地质编图技术,通过构建地质编图时空综合模型和地质代号智能识别模型,可以对多图幅的沉积岩、侵入岩、火山岩、变质岩、构造等地质要素进行人机交互式、自动化、智能化地图元综合、断层简化、线形圆滑、图幅接边等。近年来,基于该技术在青海东部地区、河南洛阳、郑州地区及京津冀多地区开展的编图实践表明,该编图技术能够显著提高地质编图工作效率,具有实际应用意义。 相似文献
18.
地质命名实体识别是识别地质文本中的地质实体并分类到准确的地质概念中的一项地质知识智能抽取任务,也是构建地质领域知识图谱的关键技术之一。本研究针对地质命名实体识别领域中复杂实体识别精度不足和样本标注成本较高这两大挑战,构建了一种地质实体识别模型BERTwwm-BiLSTM-Attention-CRF,该模型通过改进的预训练层BERTwwm并在模型中加入Self-Attention模块,显著提升了复杂地质实体的识别精度,对地质实体识别的精度达到92.67%的精确率,94.21%的召回率,以及93.29%的F1值。同时,为降低标注成本,提升小规模数据集的识别精度,本研究优化了模型构建流程,采用模型辅助标注方法,加快数据集的标注速度;改进简单数据增强方法,并利用地质字典有效扩充数据集,降低了人工标注的难度。经过实验证明,本研究提出的改进方法提高了地质实体识别效果,为地质文本分析提供了一种高效且经济的解决方案,有助于推动地质领域知识图谱的构建和地质信息的智能化处理。 相似文献
19.