第十章直线相关与回归

第一十章 直线相关回归
复华实业一、教学大纲要求
(一) 掌握内容
⒈ 直线相关与回归的基本概念。
⒉ 相关系数与回归系数的意义及计算。
⒊ 相关系数与回归系数相互的区别与联系。
(二)熟悉内容
⒈ 相关系数与回归系数的假设检验。
⒉ 直线回归方程的应用。
⒊ 秩相关与秩回归的意义。
(三)了解内容
曲线直线化。
二、 学内容精要
(一) 直线回归
1. 基本概念
直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。
直线回归方程中,ab是决定直线的两个系数,见表10-1。
表10-1 直线回归方程ab两系数对比
a
b
含义
回归直线在Y轴上的截距(intercept)。
表示X为零时,Y的平均水平的估计值。
回归系数(regression coefficient),即直线的斜率。表示X每变化一个单位时,Y的平均变化量的估计值。
系数>0
a>0表示直线与纵轴的交点在原点的上方
b>0,表示直线从左下方走向右上方,即YX增大而增大
导线测量法
系数<0
a<0表示直线与纵轴的交点在原点的下方
b<0,表示直线从左上方走向右下方,即Y焦亚硫酸钠X增大而减小
系数=0
a=0表示回归直线通过原点
b=0,表示直线与X轴平行,即Y不随X的变化而变化
计算公式
2.  样本回归系数b的假设检验
(1)方差分析;
(2)t检验。
3.  直线回归方程的应用
(1)描述两变量的依存关系;
(2)用回归方程进行预测;
(3)用回归方程进行统计控制;
(4)用直线回归应注意的问题。
(二) 直线相关
1.  基本概念
直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。
相关系数又称积差相关系数(coefficient of product-moment correlation),以符号r表示样
本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
2. 计算公式
相关系数r没有单位,其值为-1≤r≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。r值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r的绝对值等于1为完全相关。
3.  样本相关系数r的假设检验
(1)r界值表法;
(2)t检验法。
(三)直线回归与相关的区别与联系
1. 区别
(1) 资料要求:直线回归要求因变量Y服从正态分布,X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量X、Y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。
(2) 应用情况:直线回归是说明两变量依存变化的数量关系;直线相关是说明两变量间的相关关系。
(3) 意义:b表示X每增(减)一个单位时,Y平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度与相关方向。
(4) 计算:b= lxy/ lxxr = lxy/
(5) 取值范围:—∞<b<+∞ ;-1≤r≤1 。
(6) 单位:b有单位;r没有单位。
2. 联系
(1) 方向一致:对一组数据若能同时计算br,它们的符号一致。
(2) 假设检验等价:对同一样本,rb的假设检验得到的t值相等,即tb=tr
(3) 用回归解释相关:决定系数,回归平方和越接近总平方和,
r2越接近1,说明引入相关的效果越好。
  (四)秩相关
相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用
于下列资料:
⒈ 不服从双变量正态分布而不宜作积差相关分析;
⒉ 总体分布型未知;
⒊ 用等级表示的原始数据。
三、典型试题分析
1.回归系数的假设检验(  )
A.只能用r的检验代替    B.只能用t检验
C.只能用F检验          D.三者均可
答案:D
[评析]  本题考点:回归系数假设检验方法的理解。
回归系数的假设检验常用的方法有:①方差分析;②t检验。对同一样本,rb的假设检验等价,rb的假设检验得到的t值相等,即tb=tr。故回归系数的假设检验用三者均可。
2.已知r1=r2,那么(  )
  A.b1=b2                  B.tb1=tb2
  C.tr1=tr2                  D.两样本决定系数相等
      答案: D
[评析] 本题考点:直线相关系数与回归系数关系的理解
因为相关系数r和回归系数b的计算公式不同,不能推导出b1=b2rb的假设检验等价,即tr1= tb1tr2=tb2,而不是tb1=tb2tr1=tr2 ;样本决定系数为r2已知r1=r2,则两样本决定系数相等,即r12=r22
3|r|>r0.05( n-2)时,可认为两变量XY(  )
A.有一定关系            B. 有正相关关系
C.一定有直线关系        D. 有直线关系
答案: D
[评析] 本题考点:直线相关系数假设检验的理解
因为直线相关系数r是样本的相关系数,它是相应总体相关系数美国雨鸟ρ的估计值。由于抽样误差的影响,必须进行显著性检验。r的假设检验是检验两变量是否有直线相关关系。|r|>r0.05( n-2)时,P<0.05,拒绝H0,接受H1,认为总体相关系数ρ≠0,因此可认为两变量X与Y间有直线关系。
4相关系数检验的无效假设H0(  )
A.ρ=0                  B. ρ≠0
C.ρ>0                  D. ρ<0
答案: A
[评析] 本题考点:直线相关系数显著性检验中检验假设的理解
因为r是样本相关系数,它是总体相关系数ρ的估计值。要判两变量间是否有相关关系,就要检验r是否来自总体相关系数ρ为零的总体。因为即使从ρ=0的总体作随机抽样,由于抽样误差的影响,所得r值也常不等于零。
5.同一双变量资料,进行直线相关与回归分析,有(  )。
A.r>0,b<0              B. r>0,b>0
C.r<0,b>0              D. rb的符号毫无关系
答案: B
[评析] 本题考点:直线相关与回归的区别与联系的理解
因为对同一资料而言直线相关系数与回归系数的方向一致,若能同时计算br,它们的符号一致。因此,同一双变量资料,进行直线相关与回归分析,有r>0,b>0。
四、习  题
(一) ousia单项选择题
1. 下列(    )式可出现负值。
A.∑(X2                B.∑Y 2—(∑Y2/n
C.∑(Y) 2                  D.∑(X)(Y
2. Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位kg,则此方程(    )。
A.截距改变                    B.回归系数改变
C.两者都改变                  D.两者都不改变
3. 已知r=1,则一定有(    )。
A.b=1                        B.a=1
C.SY. X=0                      D.SY. X= SY
4. 用最小二乘法确定直线回归方程的原则是各观察点(    )。
A.距直线的纵向距离相等
B.距直线的纵向距离的平方和最小
C.与直线的垂直距离相等
D.与直线的垂直距离的平方和最小
5. 直线回归分析中,X的影响被扣除后,Y方面的变异可用指标(  )表示。
A.        B.
C.         D.
6. 直线回归系数假设检验,其自由度为(  )。
A.n                              B.n1
C.n2                            D.2n1
7. 应变量Y的离均差平方和划分,可出现(  )。
A.SS=SS                        B.SS=SS
C.SS=SS                        D.以上均可
8. 下列计算SS的公式不正确的是(  )。
A.              B.        
C.          D.         
9. 直线相关系数可用(  )计算。
A.                       B.
C.                       D. 以上均可
10. 当r=0时,回归方程中有(  )。
A.a必大于零                        B. a必等于
C.a必等于零                        D. a必等于
(二) 名词解释
1. 直线回归    2. 回归系数    3. 剩余平方和  4. 回归平方和    5. 直线相关
6. 零相关      7. 相关系数    8. 决定系数    9. 曲线直线化    10.秩相关
(三) 是非题
1. 剩余平方和SS剩1=SS剩2,则r1必然等于r2
2. 直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。
3. 两变量关系越密切r值越大。
(四)简答题
1. 用什么方法考察回归直线图示是否正确?
2. 剩余标准差的意义和用途?
3. 某资料n=100,XY的相关系数为r=0.1,可否认为XY有较密切的相关关系?
4. rrs的应用条件有何不同?
5. 应用直线回归和相关分析时应注意哪些问题?
6. 举例说明如何用直线回归方程进行预测和控制?
7. 直线回归分析时怎样确定因变量与自变量?
(五)计算题
1.10名20岁男青年身高与前臂长的数据见表10-2。
⑴计算相关系数并对ρ=0进行假设检验;
⑵计算总体ρ的95%可信区间。
表10-2  10名20岁男青年身高与前臂长
身  高(cm)
170
173
160
155
173
188
178
183
180
165
前臂长(cm)
45
42
44
41
47
50
47
46
49
43
>东安黑豹

本文发布于:2024-09-22 06:44:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/184476.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:直线   相关   变量   回归   关系   分析   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议