直线相关与回归分析

第九章:直线回归
依变量y的实际观测值总是带有随机误差,因而依变量y的实际观测值yi可用自变量x的实际观测值xi表示为:
            (i=1,2, …, n)
x 为可以观测的一般变量(也可以是可以观测的随机变量);
y 为可以观测的随机变量;
i为相互独立,且都服从N(0σ2)的随机变量。
在x、y直角坐标平面上可以作出无数 条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。
设回归直线的方程为:  ( 其中,a是α的估计值,b是β的估计值。)
         
式中的分子是自变量x的离均差与依变量y的离均差的乘积和,简称乘积和,记作,分母是自变量x的离均差平方和,记作SSX,a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时,=a;b叫做样本回归系数,表示x 改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x 影响y的程度; 叫做回归估计值,是当x在在其研范围内取某一个值时,y值平均数的估计值。
例题:在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。
            8-1 四川白鹅雏鹅重与70日龄重测定结果   (单位:g)
1、作散点图 以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图,见图8-3。     
2、计算回归截距a,回归系数b,建立直线回归方程首先根据实际观测值计算出下列数据:
   
   
进而计算出b、a:      
得到四川白鹅的70日龄重y对雏鹅重x的直线回归方程为:
二、直线回归的偏离度估计
偏差平方和的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。统计学已经证明:在直线回归分析中离回归平方和的自由度为n-2。于是可求得离回归均方为:     离回归均方是模型(8-1)中σ2的估计值。
离回归均方的平方根叫离回归标准误,记为,即
离回归标准误Syx的大小表示了回归直线与实测点偏差的程度,即回归估测值与实际观测值y偏差的程度,于是我们把离回归标准误Syx用来表示回归方程的偏离度。
对于【例题】有
拟合直线所以
三、直线回归的显著性检验
x和y变量间并不存在直线关系, 但由n对观测值(xi,yi)也可以根据上面介绍的方法求得一个回归方程=a+bx。 显然,这样的回归方程所反应的两个变量间 的直线关系是不真实的。 如何判断直线回归方程所反应的两个变量间的直线关系的真实性呢?这取决于变量x与y间是否存在直线关系。我们先探讨依变量y的变异,然后再作出统计推断。
1、 直线回归的变异来源
反映了y的总变异程度,称为y的总平方和,记为SSy反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为SSR
反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和或剩余平方和,记为SSr。
所以:
这表明y的总平方和剖分为回归平方和与离回归平方和两部分。与此相对应,y的总自由度dfy也划分为回归自由度dfr与离回归自由度dfr两部分,即 
     
在直线回归分析中,回归自由度等于自变量的个数,;y 的 总 自 由度;离回归自由度。于是:离回归均方,回归 均方
2、 回归关系显著性检验—F检验
x与y两个变量间是否存在直线关系,可用F检验法进行检验。
无效假设HO:β=0,备择假设HA:β≠0。
在无效假设成立的条件下,回归均方与离回归均方的比值服从        和F分布,所以可以用  
df1=1,df2=n-2     
来检验回归关系即回归方程的显著性。回归平方和还可用下面的公式计算得到:          
可得到离回归平方和计算公式为:
对于【例】资料,有  
。于是可以列出方差分析表进行回归关系显著性检验
    因为,表明四川白鹅70日龄重与雏鹅重间存在极显著的直线关系。

本文发布于:2024-09-22 04:09:22,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/359930.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:回归   直线   关系
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议