应用回归分析知识点总结

U4 违背基本假设的情况
一、异方差产生的原因
在建立实际问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同的方差。即:,当时。样本数据为截面数据时容易出现异方差性。
二、异方差性带来的问题
1、参数估计值虽然是无偏的,但不是最小方差线性无偏估计。
2、参数的显著性检验失效。
3、回归方程的应用效果极不理想。
三、异方差性的检验
1、残差图分析法
残差图分析法是一种只管、方便的分析方法。它以残差为纵坐标,以其他适宜的变量为横坐标画散点图。常用的横坐标有三种选择:(1)以拟合值为横坐标;(2)以()为横坐标;(3)以观测时间或序号为横坐标。
(a)线性关系成立;(b)x加入二次方项;(c)存在异方差,需要改变x形式
(d)残差与时间t有关。可能遗漏变量或者存在序列相关,需要引入变量。
2、等级相关系数法
等级相关系数又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可以用于小样本。进行等级相关系数检验通常有三个步骤:
第一步,做y关于x的普通最小二乘回归,求出的估计值,即的值
第二步,取的绝对值,即||,把||饱和攻击按递增或递减的次序排列后分成等级,按下式计算出等级相关系数:,其中,n为样本容量,为对应于||的等级的差数。
第三步,做等级相关系数的显著性检验。在n>8的情况下,用下式对样本等级相关系数进行t检验,检验统计量为:,如果可以认为异方差性问题不存在,如果,说明||之间存在系统关系,异方差性问题存在。(在这个检验中,原假设为:不存在异方差性)
等级相关系数可以如实反映单调递增或单调递减趋势的变量间的相关性,而简单相关系数值适宜衡量直线趋势变量间的向关系。
四、一元加权最小二乘估计
当研究的问题存在异方差性时,就不能用普通最小二乘法进行参数估计了。消除异方差性的方法通常有加权最小二乘法、Box-Cox李涛漂移变换法、方差稳定变换法。
对于一元线性回归方程来说,普通最小二乘法的离差平方和为:
,其中每个观测值的权数相同。在等方差的条件下,平方和的每一项的地位是相同的。然而,在异方差的条件下,平方和中的每一项的地位是不同的,误差项方差大的项,在平方和式子中的作用就偏大,因而普通最小二乘估计的回归线就被拉向方差大的项,而方差小的项的拟合程度就差。加权最小二乘估计的方法是在平方和中加入一个适当的权数,以调整各项在平方和中的作用。一元线性回归的加权最小二乘的离差平方和为:,其中为给定的权数。使用加权最小二乘法时,为了消除异方差性的影响,为了使各项的地位相同,观测值的权数应该是观测值误差项方差的倒数,即。误差项方差较大的观测值接受较小的权数,误差项方差较小的观测值接受较大的权数。在社会、经济研究中,经常会遇到这种特的权数,即误差项方差与x的幂函数成比例,其中,m为待定的未知参数。此时权函数为:
加权最小二乘估计照顾小残差项是以牺牲大残差项为代价的,当回归模型存在异方差时,加权最小二乘估计只是对普通最小二乘法估计的改进,这种改进有可能是细微的,不能理解为加权最小二乘估计一定会得到与普通最小二乘估计截然不同的回归方程,或者一定有大幅度的改进。另外,加权最小二乘以牺牲大方差项的拟合效果为代价改善了小方差项的拟合效果,这也并不总是研究者所需要的。在社会经济现象中,通常变量取值大时方差也大,在以经济总量为研究目标时,更关心的是变量取值大的项,而普通最小二乘恰好能满足这个要求。所以在这样的一些特定场合下,即使数据存在异方差,也仍然可以选择使用普通最小二乘估计。
五、多元加权最小二乘估计
多元线性回归有多个自变量,通常取权数为某个自变量)的幂函数,即,在p个自变量中,应该选取哪一个自变量,这只需计算每个自变量与普通残差的等级相关系数,选取等级相关系数最大的自变量构造权函数。
六、自相关性
如果一个回归模型不满足,则称为随机误差项之间存在自相关现象。这里的自相关现象不是指两个或者两个以上的变量之间的相关关系,而指的是一个变量前后期数值之间存在的相关关系。
七、自相关产生的背景和原因
产生序列自相关的背景及原因通常有以下几个方面。
1、遗漏关键变量时会产生序列的自相关性。
2、经济变量的滞后性会给序列带来自相关性。
3、采用错误的回归函数形式也可能引起自相关性。例如,假定某实际问题的正确回归函数应由指数形式来表示,但无用了线性回归模型表示,这时,误差项也会表现为自相关性。
4、蛛网现象可能带来序列的自相关性。(经济学中的蛛网模型)
5、因对数据加工整理而导致误差项之间产生自相关性。
八、自相关性带来的问题
当一个线性回归模型的随机误差项存在序列相关时,就违背了线性回归方程的基本假设,仍直接用普通最小二乘法估计未知参数,序列相关性会带来下列问题:车载卫生间
1、参数估计值不再具有最小方差线性无偏性
2、均方误差MSE可能严重低估误差项的方差。
3、容易导致对t值评价过高,常用的F检验和t检验失效。
4、当存在序列相关性时,仍然是的无偏估计量,但在任一特定的样本中,可能严重歪曲的真实情况,即最小二乘估计量对抽样波动变得非常敏感。
5、如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和进行结构分析将会带来较大的方差甚至错误的解释。
九、自相关性的诊断
1、图示法
图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项作为随机项的真实值的估计值,在描绘的散点图,根据的相关性来判断随机项的序列相关性。
1)绘制的散点图。
a表明随机扰动项存在正的序列相关,图b表明随机扰动项存在负相关。
2)按照时间顺序绘制回归残差项的图形,如果随着t的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,可断言存在相关,表明存在着序列相关。如果随着t的变化逐次变化并不断地改变符号,如下图d所示,那么随机扰动项存在负的序列相关,这种现象称为蛛网现象;如果随着t的变化逐次变化并不频繁地改变符号,而是几个正的后面跟着几个负的,则表明随着扰动项存在正的序列相关,如下图c所示。
2、自相关函数法
自相关函数的估计值为 作为自相关系数的估计值与样本量有关,需要做统计显著性检验才能确定自相关性的存在,通常采用DW检验代替对的检验。电热丝绕线机
3DW检验
DW检验是适用于小样本的一种检验方法,而且金菠萝DW检验只能用于检验随机扰动项具有一阶自回归形式的序列相关问题。DW2(1-),计算出DW值后,根据样本容量n和解释变量的数目k(包括常数项)查DW分布表,得出临界值
0D.W,
误差项间存在正相关;
D.W,
不能判定是否有自相关;
D.W4-,
误差项间无自相关;
4-D.W4-,
不能判定是否有自相关;
4-D.W4,
误差项间存在负相关。
需要注意的是,DW检验尽管有着广泛的应用,但也有明显的缺点和局限性:
化学泥浆1DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时只有增大样本容量或选取其他方法;

本文发布于:2024-09-23 13:19:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/311419.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:方差   存在   变量   检验   相关   回归   序列   估计
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议