常用相关性分析对比

相关性分析
相关性分析解决以下两个问题:
判断两个或多个变量之间的统计学关联;
如果存在关联,进一步分析关联强度和方向
下表是汇总整理的常用相关性分析,方便大家到适合自己数据的分析方法
定类变量
连杆机构
无序的:性别(男、女)、血型(A、B、O、AB);
有序的:肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)
1 相关分析
定量变量两两之间的相关程度进行分析,例如人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系
类型:
Pearson相关系数(适用于定量数据,且数据满足正态分布)
Spearman相关系数(数据不满足正态分布时使用)
Kendall's tau -b相关系数(有序定类变量)
清分机案例:研究人的身高和体重之间的关系
拿到这样一组数据,想要研究其中的相关关系,首先要做的是正态性检验,如果数据满足正态分布,使用Pearson相关系数,否则使用Spearman相关系数。
相关性的分析主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。
电化学极化
结果可知,身高体重之间存在相关性。
2 Cochran's Q 检验
用于三个字段以上二分类kappa系数定类数据的一致性检验,即相关程度分析。
案例:分析50个同学对一模、二模、三模的三次高考模拟考试的体验,体验分为难或简单,检验三次考试难度是否一样。
Cochran's Q 检验主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。
Cochran’s Q检验的结果显示,整体的显著性P值为0.572,水平上不呈现显著性,不能拒绝原假设,因此数据总体不存在差异性,三次考试难度是否一样的。
3 Kappa一致性检验
用于定类数据的相关性检验
一般Kappa系数可用于衡量分类精度,或者投票等定类数。
方法:
简单Kappa:适用于两两纯定类数据(无序)
线性加权Kappa:适用于两两有序定类数据
平方加权Kappa:同线性加权,但加重了有序定类的级别差异
Flesis Kappa:适用于三组以上的定类数据
与外婆同行
案例:问卷调查一个班级的两个体育老师对学生体育锻炼的态度(分为:从不、偶尔、经常)划分情况,需要检验是否存在一致性。
相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性
Kappa 值的大小代表的相关性解释:
显著性 值为0.936,水平上不呈现显著性,不能拒绝原假设,说明总体变量之间不存在一致性。同时,Kappa系数的值为-0.003,因此总体变量的相关性程度为极低的一致性。
4 Kendall协调系数
肯德尔(Kendall)系数用于三组以上定类数据的相关性检验,与此类似的有Kappa系数一
致性检验。这两者不同的是:Kappa系数与皮尔逊一样是比较两项之间的相关性;而Kendall系数用于判断总体(全部数据)的相关性,适用于数据是多列相关的等级资料,即可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数,可以较为客观地选择好的作品或好的评分者。
案例:分析 10 个旅游评论家对 5 个景点的打分一致性程度
相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性
Kendall值的大小代表的相关性解释与Kappa一致
Kendall系数一致性检验的结果显示,总体数据的显著性 值为0.745,水平上不呈现显著性,不能拒绝原假设,因此数据不能呈现一致性,同时模型的Kendall协调系数 值为0.049,因此相关性的程度为极低的一致性。
可见五位评委对景点的评分不具有一致性
5 组内相关系数
衡量和评价观察者间信度和复测信度的信度系数指标。通常可以用于问卷调查中评价一个对象对多个样本在一段时间的重测信度,或者判断一批对象对多个样本的一致性检验(定量定类均可)
ICC类型:
Two-way random/mixed absolute agreement:考虑了系统误差(如测量不同评委是否会给予相同选手的相同的打分)
Two-way randomfmixed consistency:不考虑系统误差(如测量不同评委给予相同选手的打分是否高度相关)
One-way random absolute agreement:用于检验每一个选手的均值是否完全相等(如相同评委在不同次数是否会给予相同选手的相同的打分)
案例:5 个评委对于同一批选手进行评分,测量其评分是否一致。或者测量复测信度,比如多次收集某个评委对 100 个参赛选手的评分(或同一批评委的评分平均值),测量其每次评分的相关度是否一致。
判断方法
1.选择测量方式,其中单个测量的是基于原始数据,而平均测量是基于原始结果经过均值或者中位数等方式处理;轻点CHINA学生CHINESE
2.分析组内相关系数对应测量方式的方差分析(P值),方可进行组内相关系数;
3.若方差分析呈现显著性(P<0.05),分析组内相关系数的效应程度,一般认为信度系数低于0.4,表示信度较差,大于0.75表示信度良好,对于定量资料常常需要更高的ICC值;
针对单个测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.957,说明该数据的信度是很强。
针对平均测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.991,说明该数据的信度是很强。

本文发布于:2024-09-20 17:26:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/720687.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   测量   信度   一致性
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议