首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
为了提高当前决策树构建的准确度,降低计算复杂度,以粒分辨关系为理论基础将属性按其值划分为若干子集(粒)作为基本判决单位,提出叶、枝划分集的逻辑式判定算法,将条件属性粒的长度作为可分配的树叶量,而其对应的决策粒作为可接受的树枝量,用叶、枝比例的强度判定该属性粒的分辨力,进而从全局分辨关系直接判定出划分属性,由顶向下进行决策树的构建。实例分析的结果表明,算法简洁且精准。  相似文献   

2.
C4.5算法与粗糙集在数据挖掘中的研究   总被引:2,自引:0,他引:2  
分类在数据挖掘中是一项非常重要的任务,而决策树方法和粗糙集方法则是分类的主要方法.在详细介绍决策树方法的经典算法C4.5算法和粗糙集方法的基础上,针对C4.5算法的不足,引人粗糙集方法,提出新算法IC4.5来弥补C4.5算法的缺陷.并设计出一个基于C4.5算法和粗糙集算法的分类器,最后通过实验来证明基于IC4.5算法的分类器在抗噪声方面要优于C4.5算法.  相似文献   

3.
提出并实现了一种中文姓名信息提取方法,该方法首先根据姓氏和名的用字概率信息,将姓氏作为抽取的触发条件,在文本中初步提取姓名。然后再充分利用中文姓名的上下文信息及姓名用字之间的关联程度的信息,选取特征作为决策树测试的属性列表,并将初步提取出来的姓名是否是真实姓名(bool型的值:yes或no)作为决策树要预测的目标属性,组建基于ID3算法的决策树进一步提取出正确的姓名,实验结果表明,该方法具有很好的召回率和准确率。  相似文献   

4.
决策树方法在环境物理量场与暴雨之间关系研究中的应用   总被引:4,自引:0,他引:4  
根据香港天文台提供的2001年8月和2002年6-7月业务区域谱模式(ORSM)物理量场预报值,运用空间数据挖掘中的决策树方法研究了空间环境物理量场变化与暴雨中心降雨量之间的关系。结果表明,研究区暴雨中心降雨量的多少与周边相对湿度,海平面高度,温度和经向风速以及这些物理量场所处的纬度位置关系密切,而与这些物理量场所处的经度位置和纬向风速关系较小。  相似文献   

5.
快速准确地获取土地利用/覆被信息是遥感领域研究的一个热点课题.本文用5种决策树分类器及MISR多角度数据,对塔里木河下游地区进行土地覆被分类研究.通过对不同波段和观测角数据组合形成的6个数据集进行分类比较发现:(1)无论使用哪种分类器,相比于天底角观测方式,多角度观测都能获得更高的分类精度,特别是能显著提高灌木,林地和草地类型的分类精度,说明多角度观测能有效地反映地物的反射异质性信息,更好地区分地物.(2)与MLC分类法相比,决策树算法的分类精度更高,特别是随机森林和C 5.0方法最为突出,说明决策树的分类能力要优于MLC法.使用多角度数据集时,这种差别更明显,说明决策树能更有效地利用多角度信息.(3)4种决策树算法(J48,Random Forest,LMT,C 5.0)使用近红外波段的分类效果好于使用红光波段的分类效果,说明近红外波段能提供更多的地物反射异质性信息.  相似文献   

6.
基于决策树模型的湿地信息挖掘与结果分析   总被引:11,自引:0,他引:11  
目前湿地成为地学、生态学研究热点,如何快速获得区域内湿地基础信息,对实现湿地的动态监测及其他领域研究具有重要意义。本文在引入地学知识的基础上,设计并实现了两景研究区不同时相影像的湿地信息提取决策树模型。评价结果显示Kappa系数均较高,分别为0.88和0.91,表明该模型快速提取湿地信息有一定应用价值。  相似文献   

7.
多时相TM影像决策树模型的水稻识别提取   总被引:2,自引:0,他引:2  
决策树模型的多时相TM影像的小尺度水稻信息提取在我国还鲜有研究。为此,本文利用水稻生长在潮湿土壤这一特性,选取TM影像中对植物含水量和土壤湿度反应敏感的短波红外波段(1.55~1.75μm),以及反映植物覆盖率、植物长势的红光波段(0.62~0.69μm)和近红外波段(0.76~0.96μm),计算水稻移栽期、灌浆期和成熟期3个时期的归一化植被指数(NDVI)和土壤含水量指数(LSWI),提出一种时间差异的决策树水稻提取模型,以唐山市滦南县南部区域为例开展了研究。经过野外实地验证表明:该模型能有效区分出水域、玉米和菜地等较易与水稻混淆的地物,水稻提取的生产者精度和用户精度分别为95.18%和98.84%,分别比单一时相高出6.78%和7.54%。  相似文献   

8.
基于决策树的蓬莱市土地覆盖信息提取   总被引:2,自引:0,他引:2  
以蓬莱市为研究区,对TM影像经过预处理后,进行典型地物的光谱分析。在此基础上,运用决策树分类法,选取影像的光谱特征值、NDWI值、NDVI值、K—T变换信息和DEM值等数据作为测试变量,选择适当阈值设定判别规则,建立决策树模型进行土地利用覆盖信息提取并做出精度评价。将其提取精度与监督分类结果精度进行比较,结果表明其分类精度有很大提高,尤其在研究区是丘陵地形的情况下,DEM数据的使用使林地、果园的可分性大大加强。  相似文献   

9.
对目前国际互联网中的异地异构生物信息数据源进行研究,分析了生物信息数据的特性,利用数据挖掘技术,设计了一种基于Web的生物信息数据仓库系统的实现方案。采用该方案,可以增强异地生物信息数据库之间的数据交互能力,提高数据库的使用效率;并为解决基于异构数据源的复杂信息数据库的设计提供参考。  相似文献   

10.
11.
介绍了判定树归纳分类法的概念及基于ID3算法的基本策略,给出通过最高信息增益构 造判定树的数据挖掘算法进行分类的预测模型,对判定树归纳分类法的具体应用给出了实例并作 分析。  相似文献   

12.
农作物种植结构是农业生产活动对土地利用的表现形式。及时精确地获取农作物的空间分布信息对指导农业生产、合理分配资源以及解决粮食安全问题等具有重要意义。目前农作物信息提取研究大多局限于中低分辨率遥感影像的NDVI时间序列,影响了作物空间分布信息提取的准确性。随着Sentinel-2A卫星成功发射,为高分辨率NDVI时间序列的构建提供了可能。本文以黑龙江省北安市为研究区,基于覆盖完整生育期的Sentinel-2A多光谱数据,构建10 m分辨率的NDVI时间序列数据集,利用 Savitzky Golay (S-G) 滤波器对 Sentinel-2A NDVI时间序列数据进行平滑。基于典型时相的多光谱数据和NDVI时间序列构建面向对象决策树分类模型进行作物类型遥感识别。通过对样本的NDVI时间序列曲线分析,可以得出NDVI时间序列能够清晰地区分作物物候差异。此外,本文还利用面向对象分类和支持向量机(Support Vector Machine, SVM)分类两种方法,对典型时相的多光谱数据进行了作物分类对比实验,并对结果进行了对比分析。研究结果表明:① 典型时相多光谱数据引入平滑重构后的NDVI时间序列能够更好地描述作物的物候特性,能够准确刻画研究区作物发育情况,有效区分各类作物;② 通过对比分类实验发现,典型时相多光谱数据引入NDVI时间序列特征,增强了不同作物之间的光谱差异,提高了作物分类精度,总体精度和kappa系数较典型时相多光谱数据进行分类的结果分别提高了7.7% 和0.055;③ 基于面向对象的决策树分类模型在作物分类的结果中精度最高,总体精度为96.2%,kappa系数为0.892。本研究的方法为其他大区域农作物的分类提供了重要参考和借鉴价值。  相似文献   

13.
机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福建省南平市蔡源流域为研究区,以四川省绵阳市北川县为验证区,从预测精度、稳定性和数据量敏感性3个方面深入对比BP(Back Propagation)人工神经网络模型和CART(Classification and Regression Tree)决策树模型在滑坡易发性分析中的效果,主要结论如下:① 在逐渐增加一定数量训练样本的过程中,BP人工神经网络模型预测精度的增长率更高。在蔡源流域内,当训练样本数量增加10 000时,BP人工神经网络模型的预测精度上升5.22%,CART决策树模型的预测精度上升2.11%。② BP人工神经网络的预测精度高于CART决策树模型,且较为稳定。在100组数据集上,BP人工神经网络模型验证集预测精度的均值和验证集滑坡样本预测精度的均值分别为81.60%和84.86%,高于CART决策树模型的72.97%和76.59%。与此同时,BP人工神经网络模型对应预测精度的标准差分别是0.32%和0.37%,小于CART决策树模型的0.35%和0.67%。③ BP人工神经网络模型分析的滑坡易发区相比CART决策树模型,更接近实际滑坡的空间分布。最后,北川县的验证实验也出现了相同的现象。  相似文献   

14.
循环经济是实现可持续发展的重要保证。本文在区域可持续发展决策支持系统研究成果的基础上,结合空间数据挖掘技术,提出区域循环经济空间决策支持系统的框架设计。并介绍了空间数据挖掘在区域循环经济决策中的一些应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号