知识引入
比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。 作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法和用于多组比较的非参数检验法。
第一节 非参数检验概述
假设检验分为参数检验和非参数检验。
参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条
件。如独立样本的T检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。教材第八章之前所介绍的统计方法都是参数检验法。
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一般是未知的;②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。
前面所学到的参数检验法在非参数法中都能到替代的方法,因此按照和参数检验法相对
应的原则可对非参数检验法进行如下分类:
第二节 非参数两组比较法
该类方法实际上对应两总体比较的t检验法。按照两个样本的相关性,又可分为相关样本检验法和独立样本检验法。其中相关样本检验法主要包括符号检验和符号等级检验两种方法;独立样本检验法主要包括秩和检验和中数检验两种方法。
一、符号检验法
符号检验法是通过对两个相关样本的每对数据之差的符号(正号或负号)进行检验,以比
较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验。其基本思想是:若两总体差异不显著,则两样本差值的正号与负号应大致各占一半,即中位数为0,可见符号检验是以中数作为统计量进行假设检验的。
1、符号检验法的假设是:
H0:差值的总体中位数为0;
H1:差值的总体中位数不为0。
2、符号检验法的步骤为:
①标记出每对数据之差的符号,正号个数记为n+,负号的个数记n-,(显然差值为0的不计算在任何一个中),这两数中最小者记为r,两数之和记为N,即:
N = n+ + n-;r = min(n+,n-)
②分两种情况进行检验:
在双侧检验,.05水平下,若Z值落在-1.96yangjiang~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。在单侧检验,.05水平下,若Z值落在-1.645~1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
上面第二种情况采用正态分布,是因为将N分成n+和n-两部分,服从二项分布,而当蓝环章鱼当宠物卖N很大时,二项分布近似于正态分布。
二、符号等级检验法
符号等级检验法是通过对两个相关样本的每对数据之差的符号(正号或负号)及等级进行检验,以比较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验。其基本思想是:若两总体差异不显著,则两样本的正负向差值的等级之和应大致相等,即分布对称,且中位数为0,可见符号检验是以中数和分布的对称性为统计
量进行假设检验的。
1、符号等级检验法的假设是:
H0:差值的总体分布对称且中位数为0;
H1:差值的总体分布不对称,或中位数不为0。
2、符号等级检验法的步骤为:
①将两相关样本数据之差按绝对值由小到大排列,若差值为0,则不参与排序;
②在各等级前添上差值的符号;
③记带正号的等级和为T+,记带负号的等级和为T-,并取两者之中最小者记为T,记有正负号的差值的个数为N;
④分两种情况进行检验:
在双侧检验,.05水平下,若Z值落在-1.96~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。在单侧检验,.05水平下,若Z值落在-1.645~1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
符号等级检验比符号检验利用了更多的数据信息,既考虑了符号,也考虑了数据的大小,因而更为常用,统计检验力更高。
三、秩和检验法
秩和检验法适用于两独立样本的差异显著性检验,用以确定两种总体的分布是否相同,对应于参数检验中两独立样本均数之差的T检验。“秩”又称等级、即按数据大小排定的顺序号,顺序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。这一方
法首先由维尔克松(Wilcoxon)提出,后由曼-惠特尼(Mann-Whitney)两人加以改进,因此又称曼-惠特尼U检验法。
1、秩和检验法的假设是:
H0:两总体分布相同;
H1:两总体分布不同。
2、秩和检验法的步骤为:
①陆虎自由人将两样本混合,由小到大排序(相同数据占平均等级);
②取容量小的样本中各数据的等级相加,记为T;
③分两种情况进行检验:(两样本的容量记为n1,n2)
a.n1≤10,n2≤10:查秩和检验表,当T1<T<T2时两总体的差异不显著,其中T1,T2是查附表14所得。
杭州行知中学b.n1>10或n2>10:秩和T趋近于正态分布,即:
因此可以采用Z统计量进行检验:
在双侧检验,.05水平下,若Z值落在-1.96~1.96之间,则表明两总体差异不显著;在此之外则表明差异显著。在单侧检验,.05水平下,若Z值落在-1.645~科学家发现前列腺素可使肺再生1.645之间,则表明两总体差异不显著;在此之外则表明差异显著。
四、中数检验法
中数检验法也适用于两独立样本的差异显著性检验,用以检验两总体是否具有相同中数。
中数检验法是用中位数作为统计量进行假设检验的方法,它将各组样本数据合在一起出共同的中位数,然后分别计算每个样本在共同中位数上、下的频数,再进行R×C表卡方检验。所以实际上中数检验法是利用卡方独立性检验进行统计决策。
1、中数检验法的假设是:
H0:两总体分布具有相同中数;
H1:两总体分布的中数不同。
2、中数检验法的步骤为:
①两样本由小到大混合排序;
②求混合排序数列的中数;
③英国毒贩阿克毛分别出每一样本中大于及小于总体中数的数据个数(中数本身并不计算在内),并列出四格表;
④对四格表进行χ2检验。
相对秩和检验法,由于中数检验只考虑每个样本里中数上下的数据个数,实际上将顺序数据降级为性质数据进行处理,所以利用数据的信息要少一些,因此可靠性也就差一些。
第三节 非参数多组比较法
多组比较的参数检验是方差分析,与之相应,非参数多组比较法也叫方差分析法。只是其主要用于等级型数据或不满足参数检验条件的场合,故亦称等级方差分析(ANOVA by ranks)。
和方差分析一样,按照实验设计不同,非参数多组比较法也包括适用于完全随机化设计的单向秩次方差分析或称克—瓦氏单向方差分析(Kruskal-Wallis H检验)和适用于随机化区组设计的双向秩次方差分析(Friedman检验)。
一、克-瓦氏单向等级方差分析
克-瓦氏单向等级方差分析对应于参数检验中完全随机化实验设计的方差分析,计算步骤如下:
①将各组数据混合并由小到大排序,再分别求出各组等级之和,记为Ri;