回归模型中,如何比较不同自变量对因变量的作用大小?

回归模型中,如何⽐较不同⾃变量对因变量的作⽤⼤⼩?
在前期内容中,我们介绍了如何对数据进⾏标准化处理,将原始的连续型变量转化为⼀个⽆量
纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异⽽带来的影响,从⽽
使不同变量的效应⼤⼩具有可⽐性,因此数据的标准化处理在实际的统计分析中也得到了较为
⼴泛的应⽤。
那么,提到不同变量的效应⼤⼩,⼤家⼀定会联想到在多因素回归模型中所得到的回归系数
例如,我们假设⾃变量分别为⾝⾼和体重,根据回归系数很容易就知道每增加1cm的⾝⾼或每增
到底谁的作⽤⼤谁的作⽤
加1kg的体重,引起的对因变量Y的影响⼤⼩,但是两者相⽐之下,到底谁的作⽤⼤谁的作⽤高中数学研究性学习
⼩呢?
标准化回归系数来进⾏判断,今天我
原始的回归系数已经⽆法回答这样的问题,我们需要借助标准化回归系数
们就来向⼤家介绍⼀下,在回归模型中这个标准化回归系数到底是个什么⿁?
标准化回归系数
VS
未标准化回归系数
1、未标准化回归系数
通常我们在构建多因素回归模型时,⽅程中呈现的是未标准化回归系数,它是⽅程中不同⾃变狐狸之歌
量对应的原始的回归系数。它反映了在其他因素不变的情况下,该⾃变量每变化⼀个单位对因
变量的作⽤⼤⼩。通过未标准化回归系数和常数项构建的⽅程,便可以对因变量进⾏预测,并
得出结论。
2、标准化回归系数
⽽对于标准化回归系数,它是在对⾃变量和因变量同时进⾏标准化处理后所得到的回归系数,
数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可⽐性,因
此可以⽤标准化回归系数来⽐较不同⾃变量对因变量的作⽤⼤⼩。
通常我们主要关注的是标准化回归系数的绝对值⼤⼩,绝对值越⼤,可认为它对因变量的影响
就越⼤。
3、两者的区别
未标准化回归系数体现的是⾃变量变化对因变量的绝对作⽤⼤⼩
绝对作⽤⼤⼩,⽽标准化回归系数反映的是
相对作⽤⼤⼩,可以显⽰出不同⾃变量对因变量影响的重要性。
不同⾃变量对因变量的相对作⽤⼤⼩
如果⽤标准化回归系数构建⽅程,得到的结论是有偏差的,因为此时⾃变量和因变量的数据都
邱泽近况
发⽣了转化,成为了标准化数据,因此标准化回归系数不能⽤于构建回归⽅程
标准化回归系数不能⽤于构建回归⽅程。
标准化回归系数
VS
每变化1个标准差的回归系数
我们在前期⽂章《回归模型中引⼊连续变量,还有哪些玩法?》中,介绍到对于连续型变量,在纳⼊多因素回归模型中时,可以将其转变为每变化1个标准差的形式,具体的操作⽅法是对原始的⾃变量进⾏标准化处理,然后再带⼊到回归模型中,所得到的回归系数即为该⾃变量每变化1个标准差对应的回归系数。
那么,我们假设此时有两个⾃变量,⼀个⾃变量的标准差为1,另⼀个⾃变量的标准差为100,两者对因变量都具有⼀定的影响。如果⽤上述每增加1个标准差对应的回归系数,来判断哪个⾃变量对因变量的影响更⼤的话,当同样变化1个标准差时,第⼀个⾃变量只需要改变1个单位,⽽第⼆个⾃变量则需要改变100个单位,因此标准差⼤的⾃变量改变起来就显得⽐较困难。此时,我们就需要⽤标准化回归系数来救场。
每增加1个标准差对应的回归系数,反映的是⾃变量每变化1个标准差时对因变量原始值变化产⽣的影响。⽽标准化回归系数,它反映的是⾃变量每变化1个标准差时,对因变量变化1个标准差产⽣的影响。
在计算每增加1个标准差对应的回归系数时,我们只需要对原始⾃变量进⾏标准化处理;⽽如果要计算标准化回归系数,则需要对原始的⾃变量和因变量同时进⾏标准化处理,标准化为标准正态分布对应的值后再构建回归模型。
SPSS操作
⼀、研究实例
某研究⼈员收集了100名研究对象的最⼤摄氧量(VO2 max),并记录了他们的年龄、体重、⼼率等信息,拟探讨年龄、体重、⼼率对VO2 max的作⽤⼤⼩,同时评价上述哪⼀个因素对VO2 max的影响作⽤更⼤。
⼆、操作步骤
1、多重线性回归
(操作步骤参考⽂章《SPSS实例教程:多重线性回归,你⽤对了么?》)
根据多重线性回归分析的结果,回归⽅程可写为:
VO2 max = 72.581 – 0.188 * age – 0.184 * weight – 0.059 * heart_rate
其实不难发现,在SPSS的回归结果中,不仅展⽰了未标准化回归系数(Unstandardized Coefficients),同时也得出了标准化回归系数(Standardized Coefficients)。
注意,未标准化回归系数更⼤的⾃变量,其标准化回归系数不⼀定更⼤。例如本例中,age的未标准化回归系数绝对值为0.188,⼤于weight的绝对值0.184,但是weight的标准化回归系数绝对值为0.325,却⼤于age的标准化回归系数绝对值0.200,说明weight对于VO2 max的影响较age 更⼤。放空管
2、数据标准化处理
互联网精准广告投放(操作步骤参考前期推送⽂章《你听说过数据标准化处理吗?》)
虽然SPSS在回归结果中可以直接输出标准化回归系数,但为了加深对它的理解,我们可以亲⾃对数据进⾏⼀遍标准化处理,对上述结果进⾏⼀下验证。
Analyze → Descriptive Statistics → Descriptives → Save standardized values as variables异度空间
通过上述步骤分别⽣成4个标准化处理后的新变量。
3、标准化回归系数
在进⾏多重线性回归时,以VO2 max的标准化形式作为因变量,以age、 weight、 heart_rate的标准化形式作为⾃变量构建模型。结果发现,所得的结果与上述结果⼀致。
相互转换关系
今天我们介绍了未标准化回归系数、每变化1个标准差的回归系数、以及标准化回归系数,最后再跟⼤家补充⼀下三者之间的相互转换关系。
每变化1个标准差的回归系数 = 未标准化回归系数 * 该⾃变量的标准差
标准化回归系数 = 未标准化回归系数 * 该⾃变量的标准差 / 因变量的标准差
⼤家可以根据上述转换关系⾃⾏进⾏验证哈。
在哦,对了,细⼼的同学会发现,在SPSS中多重线性回归可以直接输出标准化回归系数,但是在只能输出原始的未标准化的回归系数,如果我们想要计算logistic回归logistic回归中,SPSS只能输出原始的未标准化的回归系数
的标准化回归系数,⽐较不同⾃变量对因变量的相对作⽤⼤⼩,应该怎么办呢?
根据上述标准化回归系数的转换关系,在logistic回归中随机变量分布函数的标准差为π / √3 = 1.8138[1],故标准化回归系数 = 未标准化回归系数 * 该⾃变量的标准差 / 1.8138,即可计算logistic回归的标准化回归系数。

本文发布于:2024-09-22 23:37:58,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/434866.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标准化   回归系数   变量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议