相关回归分析练习题

一、 双变量相关分析
某班级12名女大学生的体重与肺活量的数据如下,试分析两者有无直线相关关系。
序号
体重(kg)
肺活量(L)
1
42
2.55
2
42
2.2
3
46
2.75
4
46
2.4
5
46
2.8
6
50
2.81
7
50
3.41
8
50
3.1
9
52
3.46
10
52
2.85
11
58
3.5
12
58
3
注:首先将这组数据通过任何一种方式输入SPSS中。其次,做散点图来判断两变量间是否存在直线相关。只有从图形上明确两变量间存在线性相关趋势,才能继续做后面的分析。
(1) 操作步骤
图像旧对话框散点图简单分布,自变量体重,因变量肺活量即可得到散点图。分析相关双变量,选择体重和肺活量,选择要进行的统计量即可。
(2) 散点图
(3) 输出结果
描述性统计量
均值
标准差
N
体重(kg
49.33
5.280
12
肺活量(L北京智能交通网
2.9025
.41442
12
好书搜索
相关性
体重(kg
肺活量(L
体重(kg
Pearson 相关性
1
.749**
显著性(双侧)
.005
N
12
12
肺活量(L
Pearson 相关性
.749**
1
显著性(双侧)
.005
N
12
12
**. .01 水平(双侧)上显著相关。
(4) 简单解释结果(包括直线相关程度是多大,是否显著?)
根据输出结果,我们可以得到:体重与肺活量之间的Pearson相关系数为0.749,属于中度相关。
二、 现已测得20名糖尿病人的血糖(y)、胰岛素x1)及生长激素(x2)的测量数据,见数据pcorr.sav。请分析糖尿病人血糖浓度与生长激素间有无相关关系。
注:从医学上来讲,血糖浓度和胰岛素间存在着密切的关系,如果忽略胰岛素的影响来分析,必然会得出错误的结论。因此,这里需要控制胰岛素影响的情况下进行偏相关分析。建议与不考虑胰岛素影响的情况下相关性进行比较。
(1) 操作步骤
(2) 输出结果
描述性统计量
均值
标准差
N
血糖(mmol/L)
10.8500
2.92585
20
生长素(ug/L)
8.9440
4.35242
20
胰岛素(mU/L)
17.3300
5.35862
20
相关性
控制变量
血糖(mmol/L)
生长素(ug/L)
胰岛素(mU/L)
--a
血糖(mmol/L)
相关性
1.000
.638
-.840
显著性(双侧)
.
.002
.000
df
0
18
18
生长素(ug/L)
相关性
.638
1.000
-.663
显著性(双侧)
.002
.
.001
df
18
0
18
胰岛素(mU/L)
相关性
-.840
-.663
1.000
显著性(双侧)
.000
.001
.
df
18
18
0
胰岛素(mU/L)
血糖(mmol/L)
相关性
1.000
.200
显著性(双侧)
.
.411
df
0
17
生长素(ug/L)
相关性
.200
1.000
显著性(双侧)
.411
.
df
17
0
a. 单元格包含零阶 (Pearson) 相关。
(3) 简单解释结果
通过上述统计分析我们可以得到如下结论:
在无控制变量时,血糖和生长素之间的相关性为0.638,为中度相关,与胰岛素的相关性为-0.840,为高度相关。
在控制变量胰岛素时,血糖和生长素的相关性为0.2,低度相关。
三、简单线性回归方程
以练习一的数据为例(即12名女大学生的体重与肺活量),试求肺活量对体重的直线回归方程并做相关的检验。
(1) 操作步骤。
分析回归线性,因变量为肺活量,自变量为体重。然后选择需要统计的统计量即可。
2)列出直线回归方程的方差分析输出结果并简单解释模型显著性情况。
我们的知识是有限的
模型汇总
模型
R
R
调整 R
标准 估计的误差
1
.749a
.562
.518
.28775
a. 预测变量: (常量), 体重(kg)。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.061
1
1.061
12.817
.005剑水蚤a
残差
.828
10
.083
总计
1.889
11
a. 预测变量: (常量), 体重(kg)。
b. 因变量: 肺活量(L
    通过上述统计表格我们可以得到方差分析F分布的P=0.005<0.05。所以拒绝原假设,说明体重和肺活量具有显著性。
3)列出直线回归方程的回归系数输出结果并简单解释各自变量显著性情况。
系数a
模型
高压绝缘材料
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
.000
.815
.001
1.000
体重(kg
.059
.016
.749
3.580
.005
a. 因变量: 肺活量(L
    通过上述统计表格我们可以得到回归系数P=0.005<0.05。所以拒绝原假设,说明肺活量回归系数具有显著性。
四、多元线性回归方程的多重共线性诊断
现已测得20名糖尿病人的血糖(y)、胰岛素(x1)及生长激素(x2)的测量数据,见数据pcorr.sav。建立以胰岛素和生长激素为自变量,血糖为因变量的多元线性回归方程时,诊断是否存在多重共线性。
(1)操作步骤
分析回归线性,选择血糖作为因变量,胰岛素和生长激素为自变量,勾选共线性诊断和相关统计量,线性回归方法为逐步,判断是否存在多重共线性。
(2)在不考虑多重共线性的基础上列出回归拟合结果。
模型汇总b
模型
R
R
调整 R
标准 估计的误差
Durbin-Watson
1
.840a
.705
.689
1.63211
2.250
a. 预测变量: (常量), 胰岛素(mU/L)
b. 因变量: 血糖(mmol/L)
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
114.703
1
114.703
43.060
.000b
残差
47.948
18
2.664
总计
162.651
19
a. 因变量: 血糖(mmol/L)
b. 预测变量: (常量), 胰岛素(mU/L)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
18.796
1.265
14.862
.000
胰岛素(mU/L)
-.459
.070
-.840
-6.562
.000
a. 因变量: 血糖(mmol/L)
通过检验我们可以得到在采用逐步分析不考虑共线性时,F检验P=0<0.05,所以拒绝原假设,所以胰岛素和血糖存在共线性。
3)指出多重共线性的相关指标数值并做解释。
模型汇总b
模型
R
R
调整 R
标准 估计的误差
Durbin-Watson
1
.840a
.705
.689
1.63211
2.250
a. 预测变量: (常量), 胰岛素(mU/L)
b. 因变量: 血糖(mmol/L)
寡头竞争
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
114.703
1
114.703
43.060
.000b
残差
47.948
18
2.664
总计
162.651
19
a. 因变量: 血糖(mmol/L)
b. 预测变量: (常量), 胰岛素(mU/L)
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
18.796
1.265
14.862
.000
胰岛素(mU/L)
-.459
.070
-.840
-6.562
.000
1.000
1.000
a. 因变量: 血糖(mmol/L)
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
胰岛素(mU/L)
1
1
1.957
1.000
.02
.02
2
.043
6.784
.98
.98
a. 因变量: 血糖(mmol/L)
通过检验我们可以得到在采用逐步分析考虑共线性时,F检验P=0<0.05,所以拒绝原假设,所以胰岛素和血糖存在共线性。

本文发布于:2024-09-22 04:18:26,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/485497.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:相关   肺活量   共线性   分析   胰岛素   体重   血糖
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议