白话空间统计二十四:地理加权回归(八)结果解读(一)

⽩话空间统计⼆⼗四:地理加权回归(⼋)结果解读(⼀)地理加权回归分析完成之后,与OLS不同的是会默认⽣成⼀张可视化图,像下⾯这张⼀样的:
中国男体
这种图⾥⾯数值和颜⾊,主要是系数的标准误差。主要⽤来衡量每个系数估计值的可靠性。标准误差与实际系数值相⽐较⼩时,这些估计值的可信度会更⾼。较⼤标准误差可能表⽰局部多重共线性存在问题。根据官⽅的说法,需要检查超过2.5倍标准差的地⽅……这些地⽅可能会有问题。
虽然在软件⾥⾯,默认只显⽰这样⼀张图,但是整个GWR分析完成之后,会⽣成⼤量的数据,今天我们就来看看ArcGIS的GWR⼯具的结果⽣成的哪些结果代表了什么东西。
幸运心
⾸先,⼯具运⾏完成之后,会⽣成⼀张辅助表 (以_supp为后缀的) ,⾥⾯会有如下信息:
下⾯简单对这些指标进⾏⼀下解释
Bandwidth 或 Neighbors:
模型中,⽤于各个局部估计的带宽或相邻点数⽬的值(看你选择的是可变还是固定,如果是可变,就
是带宽,固定,就是相邻点的数⽬),以前⼀⽽再再⽽三的强调过,核估计中,核函数对结果的影响很⼩,但是带宽对结果影响很⼤,所以这个参数是“地理加权回归”的最重要参数。它控制模型中的平滑程度。
这⾥⽤⼭东省的数据,采⽤AICc模型估计的带宽,因为数据⽤的投影坐标系,单位是⽶,所以这⾥的160536表⽰160公⾥
左右。那么我们来看看,160公⾥的带宽,在以⼭东为研究区域的范围内,覆盖多⼤的范围:
以淄博市沂源县的中⼼点,进⾏160公⾥的估算,结果如下:顺势疗法
差不多能够包括三分之⼀个⼭东省吧,当然,我这⾥的这个距离是通过AICc⽅法估算出来的,代表了在某种最优的带宽。关于AICc或者CV模型的原理,可以参考以前的⽂章:
⽩话空间统计⼆⼗四:地理加权回归(五)
这⾥需要注意的时候,当你选择不同的⽅法的时候,得出来的所谓“最优”距离都是不⼀样的。
当然,如果你在设置分析参数的时候,也可以选择固定距离或者固定临近点的数⽬,这⾥就会出现你参数⾥⾯设置的值了。
ResidualSquares
指模型中的残差平⽅和(残差为观测所得 y 值与 GWR 模型所返回的 y 值估计值之间的差值)。此测量值越⼩,GWR 模型越拟合观测数据。此值还在其他多个诊断测量值中使⽤。
EffectiveNumber坑槽修补
农业劳动生产率这个值与带宽的选择有关。是拟合值的⽅差与系数估计值的偏差之间的折衷表⽰。好吧,这个说法有些拗⼝。下⾯简单来解释⼀下这个东东是⼲嘛的。
george boole
⾸先,地理加权回归很倚赖于带宽(或者说,依赖于临近要素),那么如果我的带宽⽆穷⼤的时候,整个分析区域⾥⾯的要素都变成了我的临近要素,这样地理加权就没有意义了,变成了全局回归也就是OLS……这样,每个系数的估计值就变成OLS的估计值。
那么对于⼤的带宽来说,所有的要素都被包含进回归⽅程⾥⾯,那么回归⽅程系数的有效数量接近实际的数量(地理加权的权重都是1)。⽽对于局部来说,它的估计值就具有相对较⼩的⽅差(局部和全局差不多,值散布范围很⼩),但是偏差就⼤了(异质性何在……)
但是如果我的带宽⽆限接近0的时候,除要素本⾝以外,旁边所有的临近要素的权重都是0,这样回归⽅程的有效系数就变成了回归点本⾝(只有观测点⼀个有效系数)。那么局部系数估计值将具有较⼤⽅差但偏差较低。(所有的观察点,都有独⽴的表现,所有要素都具有独⽴性,完全体现异质性)。
这两种情况,正好是两个极端,都不是我们希望的,那么,我们就需要在中间到⼀个平衡点。EffectiveNumber这个值,就是⽤于衡量这个平衡点的数值。这个数值主要⽤于诊断不同的模型中使⽤。
Sigma
西格玛值为标准化剩余平⽅和(剩余平⽅和除以残差的有效⾃由度)的平⽅根。它是残差的估计标准差。此统计值越⼩越好。主要⽤于 AICc 计算。
AICc(关于⾚则的信息,查看上⾯给出的⽩话空间统计⼆⼗四:地理加权回归(五))
AICc是模型性能的⼀种度量,有助于⽐较不同的回归模型。考虑到模型复杂性,具有较低 AICc 值的模型将更好地拟合观测数据。AICc不是拟合度的绝对度量,但对于⽐较适⽤于同⼀因变量且具有不同解释变量的模型⾮常有⽤。
如果两个模型的AICc值相差⼤于3,具有较低AICc值的模型将被视为更佳的模型。
在很多论⽂⾥⾯,将GWR的AICc值与OLS的AICc值进⾏⽐较,然后根据AICc的值,得出局部回归模型(GWR)⽐全局模型(OLS)具有更⼤的优势。(⽽不是单纯的通过⽐较拟合度或者性能)。
R2:R 平⽅是拟合度的⼀种度量。其值在 0.0 到 1.0 范围内变化,值越⼤越好。此值可解释为回归模型所涵盖的因变量⽅差的⽐例。R2 计算的分母为因变量值平⽅和。所以增加⼀个解释变量的时候,分母不变,但是分⼦发⽣改变,这就有可能出现拟合度上升的情况(⼤部分都是假象),所以这个值仅作为参考,更准确的度量,⼤多数⽤下⾯的校正R平⽅。
R2Adjusted:由于上述 R2 值问题,校正的 R 平⽅值的计算将按分⼦和分母的⾃由度对它们进⾏正规化。这具有对模型中变量数进⾏补偿的效果,因此校正的 R2 值通常⼩于 R2 值。但是,执⾏此校正时,⽆法将该值的解释作为所解释⽅差的⽐例。
在 GWR中,⾃由度的有效值是带宽的函数,因此与像OLS之类的全局模型相⽐,校正程度可能⾮常明显。因此,AICc是对模型进⾏⽐较的⾸选⽅式。
然后后⾯就是你的因变量和⾃变量了……这个不⽤解释。待续未完。

本文发布于:2024-09-24 13:19:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/99497.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   回归   地理   带宽   解释   加权
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议