我的性经历
两组数据相关分析及检验简便⽅案
本⼈也是统计菜鸟,但经常被要求计算相关关系并检验,只好查⽂献,资料,结合⼴⼤⼤虾们的经验,总结了⼀个简单的操作流程和通俗易懂的解释,附带上对分析结果的论⽂表述(⼤虾远离、只适合菜鸟使⽤)。
中北大学学报⼀、计算⽅法(可利⽤SPSS、EXCEL等)舆情
税收征管法本⽂以SPSS为例,只要你安装了SPSS就⾮常简单了,你有两组数据(两列),打开SPSS主界⾯,将⼀组数(不带标题)拷贝到⼀个纵列Variable00001,将另⼀组数拷贝到第⼆个纵列Variable00002。
英⽂版SPSS,打开Analyze-Correlate-Bivariate 出来⼀个对话框,在这个对话框中,将左边蓝中的两个Variable放到右边栏中。correlation coefficient选取pearson,单击OK。中⽂版SPSS,点分析-相关-双变量,将Variable00001和Variable00002选作变量,其它默认,确定即可。 ⼆、结果分析
以上操作后,弹出如下窗体,只需关注相关性这个表格即可。
例1的相关性表格如下:
Variable00002 Pearson 相关性对应的0.152是相关系数,它反映了⼆者是正相关还是负相关,是密切还是不密切,这个数的绝对值越⼤则越密切,如果是负数说明⼆者负相关。显著性(双侧)是判断相关显著性,如果它<0.05说明这个相关性具有统计学意义,即⼆者真的相关。如果它>0.05则相关性不显著,即⼆者不相关。
以上表为例,0.152的相关系数,0.278>0.05,说明相关不显著。
⽤另⼀组数据为例,在此做相关分析并检验
例2相关表格如下
两组数据相关系数0.526,Sig=0.00<0.05,说明显著相关。
三、结果描述
例1中Variable00001与Variable00002不相关(r=0.152,p=0.278),例2中Variable00001与Variable00002之间的相关有统计学意义,相关显著(r=0.526,P<0.05) 。
通往大国之路四、为什么做检验,本检验的前提
为如果变量x与y之间并不存在直线关系,但由于n对观测值(Xi,Yi)也可以根据计算公式求得⼀个直线回归⽅程。显然,这样的直线回归⽅程所反应的两个变量之间的直线关系是不真实的,所以为了判断直线回归⽅程的两个变量间的直线关系的真实性,就必须对直线回归的相关系数进⾏假设检验,检验⽅法有F和t两种,⼆者是等价的,任选其⼀即可。 pearson correlation是⽪尔森相关系数,采⽤该法有前提:双变量正态分布。如果不服从,应该选⽤spearman相关系数。Sig. (2-tailed)
即对r=0的检验。当r<>0时,有可能正有可能负,所以是双尾(2-tailed)概率。
注:⽂中很多素材取⾃互联⽹,谢谢各位⼤虾!