二分类变量相关性分析spss_SPSS相关分析之两变量相关分析

一汽马自达俱乐部余姚⼆分类变量相关分析spss_SPSS相关分析之两变量相关分
什么是相关分析?
探究变量间关系及性质,能够简单有效说明两变量间存在什么关系,这些关系的常见描相关分析属于数据分析流程前端的探索性分析,探究变量间关系及性质,能够简单有效说明两变量间存在什么关系
述语句有:线性相关、正相关、负相关等。其结果在于指导下⼀步采取何种⽅法,是数据挖掘之前的基础⼯作;
相关关系的分类
相关关系从不同的⾓度有不同的分类⽅式。⾸先是按照相关关系强度划分:完全相关,弱相关和不相关。也能按照相关关系的⽅向分类:正相关和负相关。以上两种是最常⽤的分类⽅式。除此之外,还有两种分类⽅式,需要重点介绍。
线性相关和⾮线性相关
⾮线性相关。在直⾓坐标系⾥,两个变量的观测值的分布⼤致在⼀条直线上,那么这两按照相关关系形态划分,可以分为线性相关田李蓓
个变量之间的相关关系是线性关系;如果在直⾓指标系内,两个变量的观测值分布是⼀条曲线,那么它们之间的相关关系是⾮线性相关。
偏相关。单相关
复相关和偏相关
单相关是两个变量之间的关系,这两个变量⼀个是因变量,⼀个是⾃变
单相关,复相关
按照变量的个数划分,可以分为单相关
复相关是指三个或三个以上的变量之间的关系,即⼀个因变量对两个或两个量。两个变量的相关关系分析也被称为⼆元变量相关分析。复相关
偏相关综合了单相关和复相关的特点,当⼀个变量与多个变量相关,但是只关⼼其中⼀个因变量与⾃变量的关以上⾃变量的相关关系。偏相关
系,需要屏蔽其他因变量对⾃变量的影响,这样的相关关系就叫做偏相关。
相关系数
要想更精确地描述变量间的相关关系,就要计算相关关系的相关系数。计算相关系数⼀般需要⼤样本,样本容量最好⼤于30个,这样才能⽐较准确反映两个变量间的关系。相关系数r的取值⼀般介于-1~+1之间。
下⾯我们⾸先介绍双变量相关分析
双变量相关分析的步骤
问题描述:下⾯以腰围、体重、脂肪⽐重为例,来说明应该怎样进⾏相关分析。
第1步:绘制散点图
在SPSS中,绘制散点图⾮常简单。操作步骤如下:
1)点击图形图表构建程序。
2)在库中选择散点图,双击简单散点图。
3)分别将腰围和体重,拖⼊X轴和Y轴,确定即可。
观察散点图,可知:腰围与体重应该是存在线性相关性的,或者说,腰围对体重是有影响的。不过,
这相关程度(或影响程度)有多⼤,则需要进⼀步计算相关系数来度量。黄集骧
第2步:选择系数公式
因为,Pearson相关系数要求变量服从正态分布,所以在计算相关系数之前,需要先确定两变量是否都服从正态分布,或者近似正态分布。如果采⽤其它相关系数,则可以省略正态性检验。在SPSS中,判断两变量是否服从正态分布操作步骤如下:
1)点击分析描述统计-探索,进⼊探索界⾯。
2)将待判断的变量选⼊因变量列表。
3)打开绘制界⾯,选中带检验的正态图,确定。
确定后得到如下的正态性检验结果:
在SPSS中,采⽤的是K-S检验以及Shapiro-Wilk检验的结果。当Sig>0.05时,表明该变量服从正态分布,否则为⾮正态分布。如表所⽰,显然腰围和体重两个变量都是服从正态分布的,所以可以采⽤Pearson相关系数。
第3步:计算相关系数
在SPSS中,计算相关系数的操作步骤如下:
1)打开数据⽂档,点击分析-相关-双变量,进⼊相关分析界⾯。
大茴香脑2)将要判断的⼏个变量全部选⼊变量列表,确定,即可得到相关系数矩阵。
【相关系数】选项
Pearson积差相关 ,计算连续变量或是等间距测度的变量间的相关分析。应⽤最最多的⼀种分析⽅法,要求数据服从正态分布或近似正态分布;这是参数检验的⽅法;
使⽤条件:张欧亚
两个变量都是由测量获得的连续型数据,即等距或等⽐数据。
两个变量的总体都呈正态分布或接近正态分布,⾄少是单峰对称分布,当然样本并不⼀定要正态。
必须是成对的数据,并且每对数据之间是相互独⽴的。
两个变量之间呈线性关系,⼀般⽤描绘散点图的⽅式来观察。
Kendall等级相关,⽤于反映分类变量相关性的指标,适⽤于两个分类变量均为有序分类的情况。对相关的有序变量进⾏⾮参数相关检验;取值范围在-1-1之间,绝对值越⼤相关性越强,正负号表⽰相关的⽅向。此检验适合于正⽅形表格;
Spearman等级相关,计算斯⽪尔曼相关,适⽤于连续等级资料或不满⾜正态分布假设的等间隔数据,属于⾮参数统计⽅法,适⽤范围要⼴些。
【显著性检验】选项
双侧检验:侧检验只关⼼两个总体参数之间是否有差异,⽽不关⼼谁⼤谁⼩。
单侧检验:单侧检验则强调差异的⽅向性,即关⼼研究对象是⾼于还是低于某⼀总体⽔平。
【标记显著性相关】选项:⽤*号来表⽰显著型,⼀颗表⽰有显著性,两颗代表p值⼩于0.01,就认为极其显著。原假设H0:两变量不存线性相关
输出结果:
相关系数矩阵是对称矩阵,⽽且对⾓线上的相关系数全为1(即变量⾃⾝的相关系数为1)。从上表中可知,腰围和体重的相关系数
r=0.853,存在强相关;脂肪⽐重和体重的相关系数r=0.697,存在中度相关。
第4步:显著性检验
在相关系数矩阵中,查看显著性⼀⾏,腰围和体重对应的概率P=0.000(因精度的原因,看起来概率为0),显然P<0.05,即根据显著性检验,也可知腰围和体重、脂肪⽐重和体重,都存在显著的线性相关关系。
第5步:进⾏业务判断
根据前⾯的相关分析,可得到数据分析结论:
1、根据显著性判断,可知腰围与体重、脂肪⽐重与体重,都存在显著线性相关性。
2、根据相关系数,可知腰围与体重存在强相关,脂肪⽐重与体重存在中度相关。然后,再从业务上对分析结果进⾏解读,并给出相应的业务策略或建议:
1、业务解读:腰围对体重的影响很⼤,脂肪⽐重对体重的影响较⼤。
2、业务建议:要减轻体重,最好先减⼩腰围,少吃脂肪类⾷物

本文发布于:2024-09-22 07:02:28,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/184502.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:相关   变量   关系   体重   分析   正态分布   检验
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议