首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 673 毫秒
1.
地理加权回归是常用的空间分析方法,已广泛应用于各个领域,但利用此方法进行回归分析前,往往忽略了对设计矩阵进行局部多重共线性的诊断,从而导致对模型的估计不准确。因此,本文在引入了全局模型的多重共线性诊断方法的基础上,对这些方法进行了改进,改进后构建了加权方差膨胀因子法和加权条件指标方法——分解比法,用于诊断地理加权回归模型设计矩阵的多重共线性问题。实验结果表明,多重共线性不存在于全局模型,而可能存在于局部模型中,构建的两种方法能够有效地诊断地理加权回归模型的多重共线性问题,且加权条件指标方法——分解比法比加权方差膨胀因子法在诊断多重共线性问题上更有优势。  相似文献   

2.
刘宁  邹滨  张鸿辉 《测绘学报》2023,(2):307-317
作为一种经典局部加权最小二乘方法,地理加权回归建模一直受样本空间稀疏及预测变量局部共线性等因素困扰,导致建模结果不确定性呈现空间异质。通过协方差传播定律构建后验标准差精度评价指标,本文提出了一种地理加权回归建模结果不确定性度量与约束方法,并基于地表PM 2.5浓度遥感制图实例开展了验证。试验结果表明:不确定性约束后,不同参数下地理加权回归模型的拟合精度、基于样本/站点/区域的十折交叉验证精度均有改善;局部共线性导致的模型回归系数符号偏差问题得到了改正;模型预测结果奇异值及负值能被有效甄别,有效提升了地表PM 2.5浓度制图结果的可靠性。该不确定性度量与约束方法可有效保证地理加权回归模型估算结果的稳定性和有效性。  相似文献   

3.
针对采用地理加权回归模型(GWR)进行预测时输入变量较多导致计算复杂度高,而输入变量较少引起预测精度降低这一问题,提出了一种基于主成分分析的地理加权回归方法(PCA-GWR)。首先,该方法检验了气溶胶光学厚度(AOD)影响因素之间的共线性;然后,通过非线性主成分分析法(NLPCA)对影响AOD值的若干相关变量进行处理,既消除了相关变量彼此之间的多重共线性,又可以起到降维的作用;最后,利用非线性主成分分析得到较少的几个综合指标,通过地理加权回归模型对AOD值进行分析预测。为验证该方法的有效性,采用京津冀地区的AOD、高程、风速、气温、湿度、气压、坡度、坡向数据,利用Pearson相关系数法选取与AOD浓度具有较高相关性的影响因素作为常规的GWR模型的输入变量,在变量个数相同的前提下,与本文方法进行对比。研究结果表明:应用非线性主成分分析法对相关变量进行预处理后,有效地解决了变量之间的共线性,保留了原始影响因素主要信息,提高了运算效率,且该方法所得的MAE、RMSE、AIC及其拟合优度R2均优于常规的GWR模型。  相似文献   

4.
一种协同时空地理加权回归PM2.5浓度估算方法   总被引:2,自引:1,他引:1  
赵阳阳  刘纪平  杨毅  石丽红  王梅 《测绘科学》2016,41(12):172-178
针对PM2.5浓度估算中时空特征考虑不足和样本量较少的问题,该文将协同训练和时空地理加权回归相结合,提出了协同时空地理加权回归。采用两个不同参数的时空地理加权回归模型作为回归器,利用一个回归器训练另一个回归器的未标注样本,选择最优结果作为标注样本加入标注样本,通过不断学习扩大标注样本量提升模型的回归性能。以京津冀地区2015年3-7月的PM2.5浓度数据为实验数据,利用气溶胶光学厚度产品、温度、风速和相对湿度进行建模,采用不同核函数的时空地理加权回归作为对比方法进行实验。结果显示,协同时空地理加权回归性能比基于Gauss核函数时空地理加权回归提升了10%,比基于bi-square核函数时空地理加权回归提升了6.25%,证明该文方法能够提升时空样本数量不足时的PM2.5浓度估算精度。  相似文献   

5.
互联网记录了人们的日常生活,对带有位置信息的搜索引擎数据进行分析和挖掘可以获得隐藏于其中的地理信息。本文通过分析中国各省流感月度发病数与相关关键词百度搜索指数之间的相关性,选取相关性较高关键词的百度指数作为解释变量,发病数作为因变量,在采用主成分分析法消除变量共线性后,分别使用普通最小二乘回归(OLS)、地理加权回归(GWR)及时空地理加权回归(GTWR)构建流感发病数的空间分布模型。模型的拟合度能够从OLS的0.737、GWR的0.915提高到GTWR的0.959,赤池信息准则(AIC)也表明,GTWR模型明显优于OLS与GWR模型。验证结果显示,GTWR模型能准确识别流感高发地区,将该方法与搜索引擎数据结合能较好地模拟流感空间分布,为空间流行病学的研究提供预测模型和统计解释。  相似文献   

6.
针对传统的空间自回归模型拟合精度较低且无法顾及空间异质性的问题,该文提出了改进的地理加权自回归模型。并以北京市住宅小区特征价格数据为例,利用探索式空间数据分析方法分析住宅价格数据的空间自相关性,探讨其时空演变特征;建立了空间自回归模型、地理加权回归模型和地理加权自回归模型,并在模型之间进行精度对比和分析。实验结果表明:北京市住宅价格具有明显的空间相关性与空间集聚特征;由于综合考虑了空间自相关性和空间异质性,地理加权自回归模型不仅能大幅度提高模型的拟合优度和解释能力,还能更好地揭示住宅价格的空间变化规律,为数据的空间探索提供了新的方向。  相似文献   

7.
针对传统的空间自回归模型拟合精度较低且无法顾及空间异质性的问题,该文提出了改进的地理加权自回归模型。并以北京市住宅小区特征价格数据为例,利用探索式空间数据分析方法分析住宅价格数据的空间自相关性,探讨其时空演变特征;建立了空间自回归模型、地理加权回归模型和地理加权自回归模型,并在模型之间进行精度对比和分析。实验结果表明:北京市住宅价格具有明显的空间相关性与空间集聚特征;由于综合考虑了空间自相关性和空间异质性,地理加权自回归模型不仅能大幅度提高模型的拟合优度和解释能力,还能更好地揭示住宅价格的空间变化规律,为数据的空间探索提供了新的方向。  相似文献   

8.
针对传统地理加权回归方法无法解决时空非平稳性的问题,该文提出了一种路网距离约束的时空地理加权回归方法。引入时间特性,进一步把握了不同因子在时空维度影响的分异性;以路网距离度量约束,提高模型解释力。以北京市城6区1980—2015年的1 632个住宅小区特征价格数据为例,通过与直线距离约束的常规地理加权回归方法等进行比较,采用各模型的AIC与拟合优度等指标对模型置信水平高低进行评价。实验结果表明,路网距离约束的地理加权回归模型不仅能够提高模型的拟合精度,还能更好地揭示房价在时间与空间方面的变化规律。  相似文献   

9.
混合地理加权回归模型算法研究   总被引:1,自引:0,他引:1  
以迭代算法为基础,推导出混合地理加权回归模型的常系数(全局参数)和变系数(局域参数)的计算方法,并以上海市住宅小区楼盘销售平均价格为例进行验证。结果表明,混合地理加权回归模型的计算量略大于地理加权回归模型,但对样本数据的拟合更好,局域参数估计更稳健。  相似文献   

10.
针对地理加权回归参数估计采用最小二乘方法,最小二乘估计易受离群值影响,导致地理加权回归模型并不稳健的问题,该文提出基于稳健度量选权迭代的地理加权回归分析方法,核心思想是通过标准化残差构造权重函数,通过迭代加权降低离群值对回归模型参数估计的影响。利用模拟数据与真实数据进行试验,分别与GWR、RGWR进行对比分析,以MSE、MAE为指标进行性能评价。模拟数据试验中,RMIWGWR模型比RGWR模型的MSE、MAE指标分别提升9.29%和8.34%;真实数据试验中,RMIWGWR模型比RGWR模型的MSE、MAE指标分别提升63.88%和38.45%。试验表明:该方法可改善粗差存在环境下地理加权回归模型参数估计精度,提升模型拟合效果。  相似文献   

11.
偏最小二乘回归法是建立大坝位移监控模型的常用方法,该方法能够较好地处理模型初选因子之间存在的多重共线性。然而普通偏最小二乘回归法无法进行显著变量的选取,针对此问题,探讨了基于逐步回归的偏最小二乘回归法的基本原理和建模步骤。实例计算表明,通过该方法建立的模型在拟合效果和预报能力方面均优于普通偏最小二乘回归法。  相似文献   

12.
针对时空地理加权回归模型(GTWR)进行预测时,输入变量较多导致计算复杂度高,而输入变量较少引起预测精度降低这一问题,提出了一种基于主成分分析的时空地理加权回归方法(PCA-GTWR)。该方法采用非线性主成分分析方法,先对影响PM2.5浓度的若干相关变量降维处理得到几个综合指标,并将其作为GTWR模型的输入变量进行预测。为验证该方法的有效性,采用北京市2014-04—2017-03的PM2.5数据,利用Pearson相关系数法选取与PM2.5浓度具有较高相关性的影响因素作为常规的GTWR模型的输入变量,在变量个数相同的前提下,与本文方法进行对比。结果表明应用非线性主成分分析方法对相关变量进行预处理后,有效地解决了变量之间的共线性,保留了原始影响因素主要信息,提高了运算效率,且该方法的MAE、RMSE、AIC均低于常规的GTWR模型,拟合优度GF最高达到88.11%。  相似文献   

13.
大坝回归建模中常常因自变量间的多重共线性产生"病态"问题,使得回归系数无法真实反映环境因子对大坝变形的影响.利用岭回归建立大坝变形模型,采用L曲线法对岭回归模型中岭参数进行求解,相比最小二乘方法直接得到的系数,岭回归模型求解结果更符合实际,且所建立模型能对大坝变形进行有效预测.  相似文献   

14.
针对在地基GNSS水汽反演的过程中,天顶湿延迟转换为大气可降水量时如何建立精确的大气加权平均温度(Tm)模型的问题,该文在建立Tm模型前全面考虑了对Tm有显著影响的变量并选择最优回归子集。但分析发现,最优回归子集中各变量之间存在较强的相关性,这将会导致变量之间存在多重共线性,从而影响模型的稳定性和可靠性。选择2013—2015年相关气象数据作为变量并应用岭回归的方法削弱变量之间的多重共线性,建立稳定的多因子Tm回归模型。并利用该模型分别预测2016年1—12月、2019年1—7月的Tm,均方根误差分别为2.3 K和2.0 K,预测精度较高,这将为高精度的水汽反演奠定较好的数据基础。  相似文献   

15.
邓悦  刘洋  刘纪平  徐胜华  罗安 《测绘通报》2018,(3):32-37,42
近年来,我国大部分地区屡遭洪涝与干旱两种自然灾害侵袭,对重洪涝干旱区域进行空间插值具有重要的意义。针对传统地理加权回归(GWR)模型建模过程中模型识别和参数估计易受观测值异常点影响的问题,本文提出了一种基于吉布斯采样的贝叶斯地理加权回归(GBGWR)方法。运用基于吉布斯采样的马尔可夫链蒙特卡罗贝叶斯方法,估计地理加权回归模型参数,通过平滑函数降低观测值中异常点位数据,最后对湖南省1985-2015年35个观测站点的降水观测数据进行了空间分布模拟。试验结果表明,本文提出的方法相较于GWR模型性能提高了19.8%,相较于BGWR模型性能提高了8.2%,该方法可以有效降低异常值和"弱数据"对回归结果的影响,能够更加真实地模拟湖南省降水量的空间分布。  相似文献   

16.
针对离群值存在时地理加权回归模型拟合效果较差的问题,本文提出了基于IGGⅢ的地理加权回归方法。核心是采用IGGⅢ方案中的权函数计算权重矩阵,将权因子用于地理加权回归参数估计模型。利用模拟数据和真实数据与GWR、ACV-GWR进行对比试验,以MSE、MAE和R2作为指标对结果进行评价。模拟试验结果显示,IGGⅢ-GWR比GWR性能分别提升了51.14%、23.77%、28.4%,比ACV-GWR分别提升了49.96%、22.57%、27.1%;真实试验结果显示,IGGⅢ-GWR比GWR性能分别提升了12.65%、7.44%、0.37%,比ACV-GWR分别提升了11.85%、6.96%、0.34%。试验结果表明,基于IGGⅢ的地理加权回归可提高模型的抗差能力,拟合效果更好。  相似文献   

17.
一种局部多项式时空地理加权回归方法   总被引:1,自引:0,他引:1  
基于加权最小二乘估计的时空地理加权回归方法,在随机项方差相同且最小的假设条件下估计回归参数和拟合值,由于没有考虑时空分析中异方差影响而导致估计结果存在一定偏差。局部多项式估计是一种消除异方差影响的非参数估计方法。本文在局部多项式估计原理基础上,提出了局部多项式时空地理加权回归方法。它是采用三元一阶泰勒级数展开式重构时空回归系数和自变量矩阵,进而建立满足高斯-马尔可夫独立同分布假定要求的新模型,利用新模型回归系数估计值、拟合值以及新模型与原模型的关系,可得到原模型回归系数估计值和拟合值。本文采用模拟数据和真实数据进行试验,以GTWR与局部线性地理加权回归作为对比方法,从方法适用性、整体估计效果、回归系数估计偏差和拟合优度、整体估计偏差等方面分析了LPGTWR方法性能,有效证明了LPGTWR方法能消除异方差影响提升估计精度。  相似文献   

18.
以京津冀地区为研究对象,结合地理国情数据开展PM_(2.5)浓度估算方法的研究,在相关因素分析的基础上,运用土地利用回归方法与地理加权回归方法建立PM_(2.5)浓度空间分布回归模型,采用十折交叉验证对比模型稳定性与拟合精度,探索研究区最优建模方法及PM_(2.5)重要影响因子。结果表明:从模型稳定性及拟合精度来看,地理加权回归模型优于土地利用回归模型,模型调整后的R2分别为0.85、0.832,平均相对误差为12.4%、13.8%,均方根误差为10.61μg/m3、11.94μg/m3。相关分析判定结果表明,京津冀地区PM_(2.5)浓度的影响因子主要为气温、气压、房屋建筑、林地、耕地、降水、污染企业等。  相似文献   

19.
地理加权回归分析是对普通线性回归模型的扩展,将空间数据的地理位置嵌入线性回归参数之中,以此来研究空间关系的空间异质性或空间非平稳性,属于局部空间分析模型.通过地理加权回归分析可以确定两种或两种以上变量间相互依赖的定量关系,局部区域的参数估计可以得到地理空间存在的不同空间关系,核函数的选取规则和带宽参数的验证方法也是本文研究的内容.  相似文献   

20.
地理加权回归方法在小样本数据下回归分析精度往往不高。半监督学习是一种利用未标记样本参与训练的机器学习方法,可以有效地提升少量有标记样本的学习性能。基于此本文提出了一种基于半监督学习的地理加权回归方法,其核心思想是利用有标记样本建立回归模型来训练未标记样本,再选择置信度高的结果扩充有标记样本,不断训练,以提高回归性能。本文采用模拟数据和真实数据进行试验,以均方误差提升百分比作为性能评价指标,将SSLGWR与GWR、COREG对比分析。模拟数据试验中,SSLGWR在3种不同配置下性能分别提升了39.66%、11.92%和0.94%。真实数据试验中,SSLGWR在3种不同配置下性能分别提升了8.94%、3.36%和5.87%。SSLGWR结果均显著优于GWR和COGWR。试验证明,半监督学习方法能利用未标记数据提升地理加权回归模型的性能,特别是在有标记样本数量较少时作用显著。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号