首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
针对采用传统土地利用回归(land use regression,LUR)模型进行大气污染物浓度模拟时预测变量信息损失的缺陷,将主成分分析(principle component analysis,PCA)与逐步多元线性回归(stepwise multiple line regression,SMLR)相结合,提出了一种改进的LUR(PCA+SMLR)模型模拟大区域PM2.5浓度空间分布的方法。首先采用相关分析筛选与PM2.5显著相关的预测变量,然后对筛选出的预测变量进行主成分变换(PCA),最后保留所有主成分变量进行SMLR建立回归模型模拟PM2.5浓度。并以京津冀为研究区域进行实验验证,对PCR、SMLR、PCA+SMLR这3种模型的实验结果进行对比分析,结果表明,PCA+SMLR模型可提高预测变量对回归模型的贡献度,调整后R2达0.883,并且其精度检验指标及制图效果皆优于传统的LUR模型,证明了该模型可有效提高PM2.5浓度的模拟精度,对PM2.5区域联防联控具有指导意义。  相似文献   

2.
回归预测模型是对传统回归模型的进一步扩展,不仅涉及回归模型的固定参数估计,而且将模型预测纳入平差的部分内容,更加符合实际解算需求.针对在回归模型预测中经常出现待预测非公共点(自变量)含有观测误差和随机模型不准确的问题,基于EIV (errors-in-variables)模型提出了一种同时顾及所有变量观测误差的整体解法...  相似文献   

3.
王苗苗  李博峰 《测绘学报》2016,45(12):1396-1405
建立回归模型常采用最小二乘方法并忽略自变量观测误差。尽管同时顾及自变量和因变量观测误差的总体最小二乘方法近年来得到了广泛研究,但在模型预测时,依然忽略了待预测自变量的观测误差。对此,本文提出了一种严格考虑所有变量观测误差的无缝线性回归和预测模型,该模型将回归模型的建立和因变量预测联合处理,在建立回归模型过程中对待预测自变量的观测误差进行估计并修正,从而提高了模型预测效果。理论证明,现有的几种线性回归模型都是无缝线性回归和预测模型的特例。试验结果表明,无缝线性回归和预测模型的预测效果优于现有的几种模型,尤其在变量观测误差相关性较大时,无缝模型对预测效果的改善更为显著。  相似文献   

4.
变形监测的目的是针对不同的监测数据采用合适的数据处理方式,建立适当的模型,做出正确的预报,以减小事故的发生。回归模型是研究一个随机变量(因变量)和另一个或一些变量(自变量)关系的统计方法,它通常设置一些可以测量的变量为自变量建立回归方程来预测另外一些变量的变化趋势,是一种静态数据处理方式,但是在时间序列情况下,回归应该根据该变量自身以前的规律创建预测模型,这就是自回归模型,是一种动态数据处理方法,它特别适合于短期监测预报。  相似文献   

5.
针对在地基GNSS水汽反演的过程中,天顶湿延迟转换为大气可降水量时如何建立精确的大气加权平均温度(Tm)模型的问题,该文在建立Tm模型前全面考虑了对Tm有显著影响的变量并选择最优回归子集。但分析发现,最优回归子集中各变量之间存在较强的相关性,这将会导致变量之间存在多重共线性,从而影响模型的稳定性和可靠性。选择2013—2015年相关气象数据作为变量并应用岭回归的方法削弱变量之间的多重共线性,建立稳定的多因子Tm回归模型。并利用该模型分别预测2016年1—12月、2019年1—7月的Tm,均方根误差分别为2.3 K和2.0 K,预测精度较高,这将为高精度的水汽反演奠定较好的数据基础。  相似文献   

6.
针对传统最小二乘回归未能顾及数据的空间特性,且无法度量模型自变量与因变量相关性的空间变异特性的问题,本文提出利用地理加权回归方法分析小微地震频次与地形因子相关度的空间异质性。以四川地区的地震监测资料、DEM为实验数据,选取地形复杂度、坡度变率、坡向变率和地面曲率为自变量,地震发生频次为因变量,构建地理加权回归模型,并进行回归系数的空间变异分析。实验分析发现,地震频次与地形因子具有一定的相关性:地形复杂度与地震频次相关性最强;坡度变率、沟壑密度、剖面曲率与地震频次的相关性依次减弱;不同空间位置的地形因子和地震频次的相关性具有较明显的空间异质性。实验结果表明,地理加权回归可以有效地度量分析地震频次与地形因子相关度的空间异质性,研究结果可为地震及次生灾害的分析与预报提供辅助决策参考。  相似文献   

7.
亚热带森林参数的机载激光雷达估测   总被引:5,自引:2,他引:3  
付甜  庞勇  黄庆丰  刘清旺  徐光彩 《遥感学报》2011,15(5):1092-1104
通过应用机载激光雷达数据,在分析云南省中部的78块样地的基础上提出2个预测森林不同生物特性的统计模型(加权平均高度的预测模型和生物量的预测模型),并讨论了预测结果及其精确性。从激光雷达数据中提取了2组变量(树冠高度变量组和植被密度变量组)作为自变量,采用逐步回归方法进行自变量选择。结果表明,激光雷达数据与森林的平均树高和地上各部分生物量有很强的相关性。对于3种不同森林类型(针叶林,阔叶林和混交林),平均树高估测均能达到比较高的精度;生物量的估测结果是针叶林优于阔叶林,混交林的生物量与激光雷达数据则没有明显相关性。最后,对回归分析的结果和影响预测精度的因素进行讨论,认为预测结果的精度可能与森林类型、激光雷达采样时间和采样密度以及坐标误差等因素有关。  相似文献   

8.
鉴于MGM(1,n)在预测过程中,不同变量的拟合及预测残差差距较大,本文将自适应回归模型引入到不同变量的残差估计中,对整体的残差起到平滑的作用,从而抑制了残差的上扬趋势,经过实例分析,残差自适应回归MGM(1,n)的预测精度得到了明显的提高。  相似文献   

9.
针对采用地理加权回归模型(GWR)进行预测时输入变量较多导致计算复杂度高,而输入变量较少引起预测精度降低这一问题,提出了一种基于主成分分析的地理加权回归方法(PCA-GWR)。首先,该方法检验了气溶胶光学厚度(AOD)影响因素之间的共线性;然后,通过非线性主成分分析法(NLPCA)对影响AOD值的若干相关变量进行处理,既消除了相关变量彼此之间的多重共线性,又可以起到降维的作用;最后,利用非线性主成分分析得到较少的几个综合指标,通过地理加权回归模型对AOD值进行分析预测。为验证该方法的有效性,采用京津冀地区的AOD、高程、风速、气温、湿度、气压、坡度、坡向数据,利用Pearson相关系数法选取与AOD浓度具有较高相关性的影响因素作为常规的GWR模型的输入变量,在变量个数相同的前提下,与本文方法进行对比。研究结果表明:应用非线性主成分分析法对相关变量进行预处理后,有效地解决了变量之间的共线性,保留了原始影响因素主要信息,提高了运算效率,且该方法所得的MAE、RMSE、AIC及其拟合优度R2均优于常规的GWR模型。  相似文献   

10.
针对时空地理加权回归模型(GTWR)进行预测时,输入变量较多导致计算复杂度高,而输入变量较少引起预测精度降低这一问题,提出了一种基于主成分分析的时空地理加权回归方法(PCA-GTWR)。该方法采用非线性主成分分析方法,先对影响PM2.5浓度的若干相关变量降维处理得到几个综合指标,并将其作为GTWR模型的输入变量进行预测。为验证该方法的有效性,采用北京市2014-04—2017-03的PM2.5数据,利用Pearson相关系数法选取与PM2.5浓度具有较高相关性的影响因素作为常规的GTWR模型的输入变量,在变量个数相同的前提下,与本文方法进行对比。结果表明应用非线性主成分分析方法对相关变量进行预处理后,有效地解决了变量之间的共线性,保留了原始影响因素主要信息,提高了运算效率,且该方法的MAE、RMSE、AIC均低于常规的GTWR模型,拟合优度GF最高达到88.11%。  相似文献   

11.
将一元线性回归总体最小二乘平差模型展开后,以因变量和自变量改正数的平方和最小为约束条件,推导其总体最小二乘的迭代算法,并将模型扩展到多元线性回归,进一步得到线性回归模型的总体最小二乘算法。通过实例分析,证明算法的可行性和合理性。  相似文献   

12.
本文以出行发生量模型的建立为例,较为系统地讨论了近代回归分析中的自变量选择及回归诊断方法在交通调查分析建模中的应用。分析了在获取调查数据后,如何借助回归自变量选择方法来选择最佳自变量子集,以确定简捷的回归模型;文中应用回归诊断方法,讨论了修正回归模型、探测错误的调查数据的方法,从而为建立简捷、高精度的交通模型打下了基础。最后,作者提出了应用自变量选择及回归诊断方法建立出行发行量模型的一般步骤。  相似文献   

13.
地理加权回归分析是对普通线性回归模型的扩展,将空间数据的地理位置嵌入线性回归参数之中,以此来研究空间关系的空间异质性或空间非平稳性,属于局部空间分析模型.通过地理加权回归分析可以确定两种或两种以上变量间相互依赖的定量关系,局部区域的参数估计可以得到地理空间存在的不同空间关系,核函数的选取规则和带宽参数的验证方法也是本文研究的内容.  相似文献   

14.
Present methodological research on geographically weighted regression (GWR) focuses primarily on extensions of the basic GWR model, while ignoring well-established diagnostics tests commonly used in standard global regression analysis. This paper investigates multicollinearity issues surrounding the local GWR coefficients at a single location and the overall correlation between GWR coefficients associated with two different exogenous variables. Results indicate that the local regression coefficients are potentially collinear even if the underlying exogenous variables in the data generating process are uncorrelated. Based on these findings, applied GWR research should practice caution in substantively interpreting the spatial patterns of local GWR coefficients. An empirical disease-mapping example is used to motivate the GWR multicollinearity problem. Controlled experiments are performed to systematically explore coefficient dependency issues in GWR. These experiments specify global models that use eigenvectors from a spatial link matrix as exogenous variables.This study was supported by grant number 1 R1 CA95982-01, Geographic-Based Research in Cancer Control and Epidermiology, from the National Cancer Institute. The author thank the anonymous reviewers and the editor for their helpful comments.  相似文献   

15.
对于在实际应用中的直线回归问题,存在着因自变量和因变量选取不同拟合结果存在差异的情况,文中采用了一种线性拟合参数估计的新方法,即整体最小二乘法。文章在描述普通最小二乘和整体最小二乘原理的基础上,并对比其异同,并采用奇异值分解的方法来求解整体最小二乘问题。算例结果表明,采用整体最小二乘方法估计线性回归参数的精度明显高于常规最小二乘法,是一种值得借鉴的算法。  相似文献   

16.
一种局部多项式时空地理加权回归方法   总被引:1,自引:0,他引:1  
基于加权最小二乘估计的时空地理加权回归方法,在随机项方差相同且最小的假设条件下估计回归参数和拟合值,由于没有考虑时空分析中异方差影响而导致估计结果存在一定偏差。局部多项式估计是一种消除异方差影响的非参数估计方法。本文在局部多项式估计原理基础上,提出了局部多项式时空地理加权回归方法。它是采用三元一阶泰勒级数展开式重构时空回归系数和自变量矩阵,进而建立满足高斯-马尔可夫独立同分布假定要求的新模型,利用新模型回归系数估计值、拟合值以及新模型与原模型的关系,可得到原模型回归系数估计值和拟合值。本文采用模拟数据和真实数据进行试验,以GTWR与局部线性地理加权回归作为对比方法,从方法适用性、整体估计效果、回归系数估计偏差和拟合优度、整体估计偏差等方面分析了LPGTWR方法性能,有效证明了LPGTWR方法能消除异方差影响提升估计精度。  相似文献   

17.
Land use is changing at accelerated rates in Taiwan, and illegal land use change practices (ILP) are regularly observed within conservation areas. For this reason, we map high-potential areas of ILP within the Soil and water conservation zone (SWCZ) as an aid for effective land management and conducted an exploratory analysis of explanatory variables to evaluate their variability within ILP hot spots. We used variables relevant to hot spots to develop a logistic regression model and identified seven statistically significant variables. We re-applied the logistic regression approach to produce spatially explicit predictions of ILP. High probability areas are distributed along the coastal regions, covering 26% of the SWCZ, and their major drivers are related to accessibility and topography. The results from this research provide relevant information on the major drivers of ILP and high-potential areas, which can support officials in monitoring efforts for better planning and governance within the SWCZ.  相似文献   

18.
针对离群值存在时地理加权回归模型拟合效果较差的问题,本文提出了基于IGGⅢ的地理加权回归方法。核心是采用IGGⅢ方案中的权函数计算权重矩阵,将权因子用于地理加权回归参数估计模型。利用模拟数据和真实数据与GWR、ACV-GWR进行对比试验,以MSE、MAE和R2作为指标对结果进行评价。模拟试验结果显示,IGGⅢ-GWR比GWR性能分别提升了51.14%、23.77%、28.4%,比ACV-GWR分别提升了49.96%、22.57%、27.1%;真实试验结果显示,IGGⅢ-GWR比GWR性能分别提升了12.65%、7.44%、0.37%,比ACV-GWR分别提升了11.85%、6.96%、0.34%。试验结果表明,基于IGGⅢ的地理加权回归可提高模型的抗差能力,拟合效果更好。  相似文献   

19.
The goal of this study was to evaluate whether harmonic regression coefficients derived using all available cloud-free observations in a given Landsat pixel for a three-year period can be used to estimate tree canopy cover (TCC), and whether models developed using harmonic regression coefficients as predictor variables are better than models developed using median composite predictor variables, the previous operational standard for the National Land Cover Database (NLCD). The two study areas in the conterminous USA were as follows: West (Oregon), bounded by Landsat Worldwide Reference System 2 (WRS-2) paths/rows 43/30, 44/30, and 45/30; and South (Georgia/South Carolina), bounded by WRS-2 paths/rows 16/37, 17/37, and 18/37. Plot-specific tree canopy cover (the response variable) was collected by experienced interpreters using a dot grid overlaid on 1 m spatial resolution National Agricultural Imagery Program (NAIP) images at two different times per region, circa 2010 and circa 2014. Random forest model comparisons (using 500 independent model runs for each comparison) revealed the following (1) harmonic regression coefficients (one harmonic) are better predictors for every time/region of TCC than median composite focal means and standard deviations (across times/regions, mean increase in pseudo R2 of 6.7% and mean decrease in RMSE of 1.7% TCC) and (2) harmonic regression coefficients (one harmonic, from NDVI, SWIR1, and SWIR2), when added to the full suite of median composite and terrain variables used for the NLCD 2011 product, improve the quality of TCC models for every time/region (mean increase in pseudo R2 of 3.6% and mean decrease in RMSE of 1.0% TCC). The harmonic regression NDVI constant was always one of the top four most important predictors across times/regions, and is more correlated with TCC than the NDVI median composite focal mean. Eigen analysis revealed that there is little to no additional information in the full suite of predictor variables (47 bands) when compared to the harmonic regression coefficients alone (using NDVI, SWIR1, and SWIR2; 9 bands), a finding echoed by both model fit statistics and the resulting maps. We conclude that harmonic regression coefficients derived from Landsat (or, by extension, other comparable earth resource satellite data) can be used to map TCC, either alone or in combination with other TCC-related variables.  相似文献   

20.
ABSTRACT

The reliable and robust monitoring of air temperature distribution is essential for urban thermal environmental analysis. In this study, a stacking ensemble model consisting of multi-linear regression (MLR), support vector regression (SVR), and random forest (RF) optimized by the SVR is proposed to interpolate the daily maximum air temperature (Tmax) during summertime in a mega urban area. A total of 10 geographic variables, including the clear-sky averaged land surface temperature and the normalized difference vegetation index, were used as input variables. The stacking model was compared to Cokriging, three individual data-driven methods, and a simple average ensemble model, all through leave-one-station-out cross validation. The stacking model showed the best performance by improving the generalizability of the individual models and mitigating the sensitivity to the extreme daily Tmax. This study demonstrates that the stacking ensemble method can improve the accuracy of spatial interpolation of environmental variables in various research fields.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号