首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
现代金矿勘察主要是通过综合地球化学和地质测量等数字化方法对深部矿床进行研究,所需要的人力物力成本较高。而通过分析积累的金矿规格单元数据,可以建立金矿成矿情况与相关成矿元素含量之间的非线性关系,从已有的勘查数据中寻找金矿成矿的一般规律。本文基于与金矿相关的成矿元素含量数据,分别采用逻辑斯蒂回归、随机森林和决策树方法对原始数据和重采样数据进行训练,综合运用召回率、精确率和准确率对模型进行评价。通过对比发现,在训练和测试原始数据过程中,由于每组之间数据量的巨大差距,导致成矿数据被淹没;而在训练重采样数据过程中,随机森林在召回率和准确率方面均有较好的表现,分别达到了90.63%和70.78%;并最终分析了随机森林模型中不同分类边界对于金矿成矿情况预测结果的影响。利用不同的测量指标对模型进行评价分析,使模型更适用于金矿成矿预测,可有效地提高金矿勘察的效率。  相似文献   

2.
程亮 《城市地质》2021,16(4):466-473
根据项目监测实测数据,采用随机森林算法对基坑监测数据进行填充,分析了该方法的适用性、有效性,并与其他常见的数据填充方法进行对比研究.结果表明,随机森林方法作为一种集成学习方法,通过在模型训练时构造多个决策树,并输出分类结果,可以纠正普通决策树过度拟合的训练集合,且性能通常优于普通填充方法.基于随机森林方法填充后的数据,与周边数据相关性较强.在填充后的曲线图形上,还可以看到填补后数据分类性质明显,具有明显的归类特征.高质量的数据填充结果可以有效提高数据集完整性,达到高效、优质利用原有监测数据的目的.  相似文献   

3.
程亮 《城市地质》2021,16(4):466-473
根据项目监测实测数据,采用随机森林算法对基坑监测数据进行填充,分析了该方法的适用性、有效性,并与其他常见的数据填充方法进行对比研究.结果表明,随机森林方法作为一种集成学习方法,通过在模型训练时构造多个决策树,并输出分类结果,可以纠正普通决策树过度拟合的训练集合,且性能通常优于普通填充方法.基于随机森林方法填充后的数据,与周边数据相关性较强.在填充后的曲线图形上,还可以看到填补后数据分类性质明显,具有明显的归类特征.高质量的数据填充结果可以有效提高数据集完整性,达到高效、优质利用原有监测数据的目的.  相似文献   

4.
通过野外地质调查与机器学习方法的有机融合,提出了一种基于梯度提升决策树算法的岩性单元填图方法。研究以多龙矿集区为模型试验区,选择1∶5万勘查地球化学数据为基础预测数据,以1∶5万区域地质图为参考,进行基于梯度提升决策树算法的岩性预测填图模型试验。首先选择研究区内小范围空白区开展野外填图,建立原始数据集并初步构建岩性单元与预测数据对应关系;其次利用机器学习方法对预测数据进行多分类任务,进而开展目标填图区预测填图工作;最后通过概率选区选定概率较低目标区,开展进一步的小范围野外地质调查填图,对原始数据和知识库进行补充,迭代循环以上流程,直至预测填图达到要求。试验显示,随着迭代次数的增加,模型精度不断提高,并在7次迭代后模型准确率达到87%。该方法强调在实际应用中野外地质调查与基于机器学习预测填图的深度融合,以及野外实地工作在整个流程中的重要性和不可或缺性;同时能够充分挖掘已有数据资料的有用信息,用于辅助修正已有岩性填图内容,或根据已勘探区资料对邻近的未勘探区进行岩性分类,有效减少野外填图工作量,是对岩性填图方法、地质单元定量预测识别的有益探索,为区域地质填图工作提供了新的参考思路和辅助手段。   相似文献   

5.
由于支持向量机属于黑箱模型,因此在进行模型学习时无法直接对特征进行选择,而决策树模型在递归创建的过程中自身具有一定的特征选择能力。针对岩性分类问题,本文将决策树和支持向量机结合,通过决策树的建立,在考虑特征重要性的前提下,利用树节点的高度对特征进行提取,并将具有更高分类能力的特征送入支持向量机进行岩性分类。结果表明:通过决策树的特征提取,减少了支持向量机模型的输入特征,从而有效控制了模型的复杂度,使得模型更加稳定并具有更高的分类精度,测试集精度能够提升10%以上。  相似文献   

6.
笔者以甘肃省平凉市灵台县为目标研究区域,基于地理空间和历史滑坡数据,利用混合高斯聚类(GMM)优化的逻辑回归(LR)、支持向量机(SVM)、BP神经网络(BP Neural Network)、随机森林(RF)4种机器学习模型构建滑坡易发性评价分析模型。选取高程、坡度、坡向、曲率、黄土侵蚀强度、归一化植被指数、地质构造7个环境因子作为滑坡易发性影响因子,以30m栅格建立影响因子地理空间数据库,将研究区域划分为180万栅格单元。利用混合高斯聚类模型对整个研究区域的栅格单元进行聚类,得出初步的滑坡易发分区,选择易发程度最低类别中的栅格单元作为非滑坡区域,每次随机选择500个单元作为非滑坡单元,并根据历史滑坡数据将203个已知滑坡栅格单元作为滑坡单元,建立4种机器学习分类模型。利用训练好的模型对整个研究区域进行预测,绘制各算法的受试者工作曲线(ROC曲线),对各个算法的预测结果进行对比。分析结果表明,在本目标研究区域,各模型的滑坡易发区划图与实际的滑坡分布情况总体相吻合。随机森林模型的ROC曲线下面积(AUC)最大为0.96,测试集准确率最高为0.93;BP神经网络模型的ROC曲线下面积和测试集准确率次之,为0.90和0.87;支持向量机模型和逻辑回归模型的ROC曲线下面积和测试集准确率分别为0.86、0.81和0.85、0.80,均低于随机森林和BP神经网络模型。  相似文献   

7.
赵兴东  王宏宇  白夜 《矿床地质》2023,42(5):1003-1010
文章基于Inception-v3卷积神经网络模型,通过对采集的金矿石、铜矿石、铁矿石、铅锌矿、花岗岩、片麻岩、大理岩和页岩,8种岩石453张图像进行特征提取和迁移学习,建立了岩性分类的迁移学习模型,实现了岩性的自动识别和分类。每种岩石图像随机抽取4张作为测试集进行测试,剩余421张图像作为训练集参加训练,经测试全部图像的岩性分类结果均正确,识别正确率超过80%的岩石图像占测试集图像总数的90%以上。识别正确率未达到80%的图像经过处理后重新训练并测试,其识别正确率均超过了80%,表明了该模型具有良好的岩性识别能力且鲁棒性较好,为岩性识别和自动分类提供了一种新的智能分析方法。  相似文献   

8.
通过自主研发设计的非开挖随钻检测系统,采集非开挖钻进参数,进行非开挖钻进实时地层岩性识别,为非开挖施工提供安全信息保证。针对非开挖工程工勘资料缺乏,掘进地层岩性难以判断的问题,提出了一种基于非开挖随钻检测系统实时采集数据,利用随机森林算法建立地层识别模型,通过模型去识别未知地层,并将识别结果可视化展示。通过非开挖随钻检测系统在工程现场的实际应用,获得了包括钻速、扭矩、转速、拉力、泵压、泵量等钻进敏感参数作为训练样本,利用随机森林算法对采集的钻进参数进行训练,构造决策树与随机森林,对钻进参数进行分类,建立了以典型非开挖地层岩性分类为目标的分类模型,分别确定了杂填土、黏土、粉细砂、砾石和淤泥的地层分类标签。进一步,基于机器学习的分类结果,利用PCA主成分分析将地层识别特征降维至三维,实现了地层岩性识别结果的三维展示。将预测模型应用于实际工程,以验证其有效性。结果表明,该方法能在非开挖实时钻进条件下快速识别钻进地层,识别正确率高达92%。该研究成果通过采集导向随钻参数,识别非开挖掘进段地层岩性,为非开挖扩孔阶段钻具选型、泥浆设计等提供了重要信息。  相似文献   

9.
针对储层岩性种类繁多、交替频繁、组成复杂,传统方法识别精度低、效率慢的问题,本文提出一种多尺度时频空三域特征联合下的储层岩性识别方法。该方法在原始测井特征的基础上引入了互补集合经验模态分解(CEEMD)的多尺度频域分量,从而提高测井曲线的纵向分辨率。此外,构建了注意力机制优化的多尺度卷积双向门控循环神经网络(CNN-BiGRU-AT)模型,对加入了多尺度频域分量的测井数据进行时空特征提取,从而实现了对测井数据时、频、空三域特征的联合学习,最后以注意力机制优化了模型输出,减少了错误信息的传播。为了验证方法可靠性,本文选取了资料较为完整的5口井数据进行实验分析。结果表明,在不同数据组合的对比实验中,加入多尺度频域分量在训练集和验证集识别准确率分别提高了9.50%和8.66%。在与不同模型对比实验中,本文方法在样本识别准确率达到了94.11%,与支持向量机(SVM)、BP神经网络、卷积神经网络(CNN)、双向门控循环神经网络(BiGRU)和CNN-BiGRU融合模型相比,本文方法识别准确率分别提高了16.21%、14.54%、11.69%、5.05%、3.38%。  相似文献   

10.
岩性识别是储层评价中的一项重要工作。随着机器学习方法的不断发展,岩性的智能识别也成为热门研究方向。随钻测井技术目前已经得到了广泛的应用,但是受限于高温高压的钻井作业条件,随钻测井仪器只能测得少量测井参数。由于随钻测井参数较少,直接输入机器学习模型无法充分挖掘其中的信息。对此,本文将随机树嵌入引入随钻测井资料的岩性识别。该方法将低维随钻测井数据通过二叉树编码并转化为高维稀疏特征,利用升维后的数据进行训练从而提升机器学习模型的判别能力。对比实验结果表明,使用随机树嵌入的随机森林方法具有最佳的识别效果,准确率和F1值较直接使用随机森林分别提升了3.16%和3.25%,且优于梯度提升树、极随机树和粒子群优化支持向量机算法。  相似文献   

11.
基于机器学习的区域滑坡灾害预警模型研究   总被引:1,自引:0,他引:1  
中国滑坡灾害严重,区域滑坡灾害预警是防灾减灾的重要手段之一,预警模型是开展区域滑坡灾害预警的关键问题。本文系统开展了基于机器学习的区域滑坡灾害预警模型研究,并以四川省青川县为例,基于近10年地质与气象数据,构建了青川县区域滑坡灾害预警模型并开展实例校验。研究得出如下结论:(1)提出了基于机器学习的区域滑坡灾害预警模型的构建方法,主要包括训练样本集构建、样本学习训练与优化建模、模型保存与预警输出等几个关键步骤。(2)提出了区域滑坡训练样本集的构建方法,即以正样本为基础,在时空约束条件下随机采样获取负样本,最终获得完整的训练样本集。(3)样本学习训练中,以训练样本集的80%作为训练集,20%作为测试集,进行5折交叉验证,采用精确度、ROC曲线和AUC值校验模型准确度和模型泛化能力。采用贝叶斯优化算法进行模型优化。(4)实际预警中,调用训练好的预警模型输出滑坡灾害可能发生的概率。依据概率大小,分级确定预警等级。分级依据为:当输出概率P≥40%且P<60%时,发布黄色预警;当输出概率P≥60%且P<80%时,发布橙色预警;当输出概率P≥80%时,发布红色预警。(5)以青川县为例,构建了青川县区域滑坡训练样本集,采用6种机器学习算法进行模型训练,结果显示随机森林算法表现最好,其准确率最高(0.963),模型无过拟合现象,模型泛化能力最好(AUC=0.986);其次为逻辑回归算法;再次为人工神经网络算法和决策树算法。选取2018年6月26日的青川县日常预警业务进行实例校验。结果显示:当日17处滑坡灾害点中,100%的灾害点全部落入预警区范围内,其中:70.6%的滑坡落在红色预警区内,17.6%的滑坡落在橙色预警区内,11.8%的滑坡落在黄色预警区内。  相似文献   

12.
基于岩石图像深度学习的岩性自动识别与分类方法   总被引:8,自引:3,他引:5  
张野  李明超  韩帅 《岩石学报》2018,34(2):333-342
岩石岩性的识别与分类对于地质分析极为重要,采用机器学习的方法建立识别模型进行自动分类是一条新的途径。基于Inception-v3深度卷积神经网络模型,建立了岩石图像集分析的深度学习迁移模型,运用迁移学习方法实现了岩石岩性的自动识别与分类。采用此方法对所采集的173张花岗岩图像、152张千枚岩图像和246张角砾岩图像进行了学习和识别分类研究,通过训练学习建立岩石图像深度学习迁移模型,并分别采用训练集和测试集中的岩石图像对模型进行了检验分析。对于训练集中的岩石图像,每组岩石分别用3张图像测试,三种岩石的岩性分类均正确,且分类概率值均达到90%以上,显示了模型良好的鲁棒性;对于测试集中的岩石图像,每组岩石分别采用9张图像进行识别分析,三种岩石的岩性分类均正确,并且千枚岩组图像分类概率均高于90%,但是花岗岩组2张图像和角砾岩组的1张图像分类概率值不足70%,概率值较其他岩石图像低,推测其原因是训练集中相同模式的岩石图像较少,导致模型的泛化能力减小。为了提高识别精确度,对准确率较低的岩石图像进行截取,分别取其中的3张图像加入训练集进行再训练,增加与测试图像具有相同模式的训练样本;在新的模型中,对3张图像进行二次检验,测试概率值均达到85%以上,说明在数据足够的状况下模型具有良好的学习能力。与传统的机器学习方法相比,所提出的岩石图像深度学习方法具有以下优点:第一,模型通过搜索图像像素点提取物体特征,不需要手动提取待分类物体特征;第二,对于图像像素大小,成像距离及光照要求低;第三,采用适当的训练集可获得较好的识别分类效果,并具有良好鲁棒性和泛化能力。  相似文献   

13.
断层是影响煤矿安全的致灾地质因素,查明断层特征是煤矿三维地震勘探的主要目的之一。常规断层解释中采用的人机交互解释方法,其可靠性在一定程度上取决于解释者的经验。为提高断层解释精度,提出一种基于主成分分析和最近邻算法来检测沿目标层断层分布的方法。首先,选择峰峰矿区羊东煤矿作为研究区域,从矿区高精度处理后获得的三维地震数据中提取10个地震属性;然后,采用主成分分析法(PCA)将上述10个地震属性整合为6个综合属性;同时,将属性信息与从矿区15口井和3条巷道确定的139个点的断层信息相结合,构建已知数据信息;在该数据信息的基础上,分别组建出数据集1和数据集2两种数据集,2种数据集的训练集与测试集的比分别为9∶1和3∶7。利用这些数据集以及十折交叉验证的方法,开展基于最近邻算法(kNN)的断层识别准确率测试,数据集1的测试准确率为87.75%,数据集2的测试准确率为71.63%;这表明训练数据量越大,断层识别准确率越高,从而也说明高密度三维地震在该方法的应用中存在一定优势。在对kNN模型的分类性能进行测试时,使用通过PCA进行降维处理的数据作为输入,计算出的分类准确率分别为89.23%和73.79%;这是因为PCA降低了原始输入特征的维数,从而减少了所需的计算量并提高了这些特征的表征能力。综合结果表明,结合PCA和kNN方法可以有效地识别断层分布,减少主观人为因素的影响,提高断层解释的效率。   相似文献   

14.
决策树方法在遥感地质填图中的应用   总被引:4,自引:0,他引:4  
孙赜  白志强  樊光明  施彬 《地球科学》2004,29(6):753-758
决策树理论在遥感分类中, 分类准确、高效.依据其理论方法, 对青海省民和地区的遥感数据———ETM + (enhanced thematic mapper plus) 进行了分类, 选用的ETM +数据为1999年10月份数据, 数字高程(DEM) 数据来自于1:2 5万民和幅地形图, 数据格式为MapInfo通用格式MIF, 数据进行了坐标转换(地理坐标), 对原始数据进行了处理, 从等高线中提取数字高程.对遥感数据进行地形及光照矫正, 计算植被因子及缨帽变换的3个分量, 同其他5个遥感波段结合形成原始分类图层, 同时确定目标分类结果.原始数据的采样基于目视, 首先采用不同的彩色合成方案突出不同的目标地物, 交互式进行采样, 使用IDL语言编制程序从原始数据中提取地物数字信息, 使用Clementine7.2对数据进行处理, 其中10 %的采样数据验证模型准确率, 其余数据用来推算模型, 对数据进行10次迭代, 同时给予75 %的剪枝, 得到区分不同地物(如红层、黄土等) 的最合适图层(band 1 & band 3)和具体数值, 形成决策树模型, 将决策树模型导入Envi4.0中, 对原始数据(9个图层) 进行计算形成初步分类结果图, 对初步分类结果图进行一定的碎片合并, 最终形成分类结果图.该图同1:2 5万地质图进行对比确认分类的效果, 同传统分类图比较确认决策树分类方法优于传统分类.另外来自于决策树所提取的信息, 有利于地学知识的归纳总结   相似文献   

15.
大数据及机器学习技术在解决各行各业的复杂非线性关系问题方面已经体现出巨大的优势。本文尝试将随机森林(RF)算法引入三维成矿预测领域来开展研究,以胶东大尹格庄金矿为研究对象,在构建招平断裂(地质体)三维模型的基础上,通过各种空间分析方法提取控制矿体形成的若干控矿地质因素特征值,进而获取成矿空间中控矿地质因素分布值,最后将矿区钻孔立体单元化形成采样数据集并利用RF算法对矿区开展三维矿体定位预测,结果表明:决策树棵数M=800、属性个数K=7是最优参数,能获得总体精度97.32%和kappa系数0.6292的综合分类精度;RF算法的分类精度要优于支持向量机(SVM)算法和多层感知器(MP)算法。RF算法对大尹格庄金矿开展的三维矿体定位预测取得了较好效果,并在矿区深边部预测了7个三维找矿靶区,证明大数据技术在矿产资源定位预测方面具有巨大的应用前景。  相似文献   

16.
福建省滑坡灾害群发,点多面广,开展区域滑坡灾害预警业务是有效防灾减灾的重要手段,预警模型的科学性和有效性是预警业务的核心问题。传统区域滑坡灾害预警模型,受到滑坡诱发机理复杂、数据积累有限,以及大数据分析方法不足等限制,存在预警精度有限、精细化不足等问题。本文基于近9年地质与气象大数据,采用随机森林算法,构建了福建省区域滑坡灾害预警模型并开展实例校验。研究得出如下结论:(1)提出区域滑坡灾害训练样本集构建的优化方法,并构建了福建省区域滑坡灾害训练样本集,样本集包括地质环境、降雨等26个输入特征属性和1个输出特征属性,涵盖了福建省近9年(2010~2018年)全部样本数量达15 589个(其中:正样本3562个,负样本12 027个,正负样本比例约1︰3.4);(2)基于随机森林算法,对福建训练样本集进行学习训练、模型优化和模型存储。模型训练采用5折交叉验证法,采用贝叶斯优化算法进行模型参数优化,采用精确度、ROC曲线和AUC值等指标校验模型准确度和模型泛化能力。优化后的模型准确率和泛化能力均较好(准确率94.3%,AUC为0.954);(3)选取2021年6月22日和28日的实际滑坡灾害...  相似文献   

17.
探索利用高光谱数据的岩性填图新方法是遥感地质应用领域的重要需求之一。本文运用随机森林方法和EO-1Hyperion高光谱数据,对新疆塔里木西北部柯坪地区的局部区域进行岩性分类,并对相关问题进行分析。分别利用光谱特征以及加入光谱一阶导数特征进行岩性分类,并对不同特征对岩性分类的重要性进行分析,同时与现有的基于光谱角制图方法(SAM)进行比较。结果表明,与SAM方法相比,随机森林方法得到了更高精度的岩性分类结果,是一种有效可行的岩性分类方法。根据特征重要性的排序,蓝绿光波段、短波红外波段以及相应的一阶导数特征对研究区Hyperion数据的沉积岩岩性分类贡献更大。  相似文献   

18.
《地下水》2016,(5)
利用元素俘获谱测井法得到的主要造岩元素信息,区分被测地层的岩性成因大类属性。通过收集、分析大量的沉积岩和岩浆岩的主要造岩元素含量实测数据,构建并训练多层感知器人工神经网络模型,最终得到了利用岩石主要元素组成数据区分样品本身岩性成因的一种方法。模型通过完全不参与人工神经网络构建与训练的实测数据测试,平均分类准确率达到94%以上,在元素俘获谱测井岩性解释方面具有较好的应用前景。  相似文献   

19.
对覆盖区下伏岩体的有效识别是实现深部找矿突破的关键,近年来机器学习理论的发展为岩性识别提供了新的思路。梯度提升决策树(GBDT)算法是以决策树为基函数的集成学习方法,算法通过将学习得到的多个树模型进行集成,可以达到同时减少模型方差和偏差的效果。本文以地球化学元素数据为基础,利用GBDT算法进行岩性识别研究,并将所得结果与KNN、SVM和决策树3种机器学习算法进行对比,结果表明,针对岩性识别问题,GBDT算法具有更高的精度,可以作为岩性识别的参考技术,具有一定的推广和应用价值。  相似文献   

20.
岩性识别是遥感图像分类的难点,也是遥感地质应用的难点和热点。从遥感地质应用的实际需求出发,以西昆仑地区侏罗纪沉积岩地层为例,通过尺度转换提取高分遥感图像的多尺度纹理信息,采用波段叠加的方式协同多尺度纹理信息与ASTER影像多光谱信息进行岩性识别方法研究。利用WorldView-2全色数据进行向上尺度转换,形成空间分辨率分别为0.5,2,5,10,15,30m6种尺度图像数据,基于灰度共生矩阵提取各尺度上的纹理信息;将不同尺度的纹理信息分别与ASTER多光谱数据叠加形成协同数据;采用监督分类方法对研究区协同数据进行岩性分类。结果表明:(1)岩性纹理信息对空间尺度表现出依赖性,纹理信息量及含义随空间尺度不同而变化;(2)每套特定岩层因其独特的几何空间结构特征(厚度、产状、夹层、互层等)都有与之相适应的最佳纹理尺度,且该最佳尺度下纹理与光谱的协同效应最大;(3)纹理信息与多光谱数据形成的协同数据能有效提高岩性分类的精度,分类精度提高的程度与纹理计算的尺度相关。研究区岩性分类结果显示当纹理尺度为10m时,与仅基于ASTER纯光谱分类结果相比,精度提高了约6.9%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号