【科研加油站】SPSS操作之双因素方差分析(Two-wayANOVA)

【科研加油站】SPSS操作之双因素⽅差分析（Two-wayANOVA）

以下内容转载⾃“医咖会”（medieco-ykh），作者李侗桐。

上⼀期我们讨论了单因素⽅差分析，本期“科研加油站”栏⽬，我们⼀起来探讨双因素⽅差分析(Two-way ANOVA)。

问题与数据

某研究者已知受教育程度可以影响政治兴趣，即如果将受试者的受教育程度分为“School”、“College”和“University”3个等级（级别依次递增），他们对政治的兴趣随受教育程度的增加⽽增加。

该研究者拟进⼀步分析受试者这种受教育程度与政治兴趣的相关关系是否受性别影响。他计划招募60位受试者，包括30位男性和30位⼥性。每⼀个性别中，受试者的受教育程度均分为3类：“School”、“College”和“University”，每类10⼈。

该研究者采⽤问卷测量受试者的政治兴趣，受试者得分在0-100之间分布，分数越⾼，政治兴趣越强。

最终，收集受试者政治兴趣(political_interest)、性别(gender)和受教育程度(education_level)等变量信息，部分数据如下：

注释：在本研究中，“School”是指16岁之前接受的教育程度，“College”是指在16到18岁之间的教育程

度，“University”是指18岁以上接受的教育程度。

对问题的分析

研究者已知⼀个⾃变量（受教育程度）对因变量（政治兴趣）的影响，想判断另⼀个⾃变量（性别）对这⼀相关关系是否存在作⽤。针对这种情况，我们可以使⽤双因素⽅差分析，但需要先满⾜6项假设：

假设1：因变量是连续变量

假设2：存在两个⾃变量，且都是分类变量

假设3：具有相互独⽴的观测值

假设4：任⼀分类中不存在显著异常值

假设5：任⼀分类中残差近似正态分布

假设6：任⼀分类都具有等⽅差性

那么，进⾏双因素⽅差分析时，如何考虑和处理这6项假设呢？

对假设的判断

一七一三

3.1 假设1-3

因变量是连续变量；存在两个⾃变量，且都是分类变量。这两个假设与研究设计有关，需要根据实际情况判断。

⾄于假设3，我们之前介绍过使⽤Durbin-Watson检验判断观测值是否相互独⽴的⽅法，这⾥不再赘述。同时，我们也认为观测值是否相互独⽴主要与研究设计有关，也需根据实际情况判断。

3.2 假设4-6

检验假设4-6需要⽤到残差，因此我们先运⾏双因素⽅差分析的SPSS操作，得到主要结果和相应残差变量后，再逐⼀进⾏对假设的检验。

⾏对假设的检验。

3.2.1 主要SPSS操作

(1) 在主菜单点击Analyze→General Linear Model→Univariate

出现下图：

(2) 分别将political_interest放⼊Dependent Variable栏，性别（gender）和education_level放⼊Fixed Factor(s)栏

(3) 点击Plots，弹出下图

(4) 分别将gender和education_level放⼊Separate Lines和Horizontal Axis栏

(5) 点击Add，Plots栏内出现education_level*gender标识

(6) 分别将gender和education_level放⼊Horizontal Axis和Separate Lines栏

(7) 点击Add，Plots栏内出现gender *education_level标识

(8) 点击Continue→Options，弹出下图：

(9) 将gender *education_level放⼊Display Means for栏中，并在Display下点击Deive statistics、Estimates of effect size和Homogeneity tests

(10) 点击Continue→Save，弹出下图：

(11) 在Predicted Values中点击Unstandardized，并在Residuals中点击Unstandardized和Studentized

(12) 点击Continue→OK

上述操作将可以得到双因素⽅差分析的结果，并⽣成3个新变量：预测值(PRE_1)，残差(RES_1)和学⽣化残差(SRE_1)。在对假设4-6的检验中，我们将⽤到这些新⽣变量。

但是，在检验假设4和假设5之前，我们还需要先拆分数据（即将数据根gender和education_level均分成6类），运⾏检验操作，再合并数据。

•拆分数据

(1) 点击Data→Split File

出现下图：

(2) 点击Compare groups

(3) 将gender和education_level放⼊Groups Basedon栏

(4) 点击OK

•针对每⼀分类，检验异常值(假设4)和残差正态性(假设5)

(1) 点击Analyze→Deive Statistics→Explore

出现下图：

(2) 将RES_1放⼊Dependent List栏

(3) 点击Plots，弹出下图：

(4) 去掉点选Deive栏中的Stem-and-leaf，点选Normality plots with tests

(5) 点击Continue

(6) 在Display栏中点击Plots

(7) 点击OK

3.2.2 假设4：任⼀分类中不存在显著异常值

与其他⽅差分析⼀样，双因素⽅差分析对异常值⾮常敏感。这些数据不仅会扭曲各分类之间的差异，还会影响结果的外推性。因此，我们必须充分重视分析中的异常值。

经上述SPSS操作，软件会⾃动输出本研究中每⼀分类的箱式图，共6个。以下⾯两个举例：

左侧是⼥性、受教育程度为“College”组的箱式图，未提⽰存在异常值。右侧是男性、受教育程度为“University”组的箱式图，也未提⽰异常值。本研究的其他4组的箱式图也是同样的情况，证明该研究数据满⾜假设4。

richtextbox为了让⼤家更清楚地解释使⽤箱式图判断异常值的⽅法，我们以⼀个存在异常值的箱式图举例如下：

该图提⽰，在⼥性、学历程度为“University”组存在异常值，第57位(row number)受试者的政治兴趣⾮常低，应考虑进⾏异常值调整或剔除。

异常值调整或剔除。

如果存在异常值，我们应该如何做呢？

如果不希望或者不能剔除异常值，我们可以将其保留。可以采取以下4种办法：

(1) 选择更稳健的双因素⽅差模型；

(2) 调整异常值，如⽤第⼆⼤极值取代异常值；

(3) 对⾃变量进⾏数据转换；

(4) 确认异常值存在不会影响结果，如分别运⾏纳⼊和不纳⼊异常值的模型，若结果没有差异，可以保留异常值。

当然，我们也可以直接剔除异常值，但这往往是我们迫不得已的做法。因为我们进⾏数据分析是为了根据样本结果推论总体，但直接剔除异常值就相当于不再考虑这部分⼈的信息，忽略了他们在总体⼈中的作⽤。

如果⼀定要剔除异常值，我们就应该在报告中描述被剔除者的信息(数据以及对研究结果的影响)。这样读者就可以清楚地了解到我们剔除异常值的原因以及这些异常值可能存在的影响，消除⼤家对研究结果的质疑。

3.2.3 假设5：任⼀分类中残差近似正态分布

本研究采⽤Shapiro-Wilk检验数据正态性。看过往期栏⽬内容后，⼤家应该知道检验数据正态性的⽅法有很多种。本研究采⽤Shapiro-Wilk检验的原因在于每⼀组中的样本量较⼩，⽽Shapiro-Wilk检验主要适⽤于这种⼩样本的正态性检验（样本量<50）。

SPSS输出Shapiro-Wilk检验结果如下：

⼀般来说，如果Shapiro-Wilk检验的P值⼩于0.05，我们就认为数据不符合正态分布。从上表可知，本研究中每⼀个分组的P值都⼤于0.05，即任⼀分类中残差近似正态分布，满⾜假设5。

如果残差不接近正态分布，我们应该如何做呢？

我们可以采取以下4种办法：

(1) 转换数据；

一虎一席谈2012(2) 因为⽅差分析对假设5并不是⾮常敏感，即使残差不接近正态分布，我们也可以尝试采⽤双因素⽅差模型；

(3) 检验模型结果。因为没有可以替代双因素⽅差分析的⾮参数检验⽅法，我们只能对⽐数据转换前后的模型，判断直接采⽤双因素⽅差分析是否合理；

(4) 选择更稳健的双因素⽅差模型。

3.2.4 假设6：任⼀分类都具有等⽅差性

任⼀分类都具有等⽅差性是双因素⽅差分析的基本假设，可以通过Levene⽅差齐性检验完成。

通过3.2.1的操作，SPSS输出结果如下：

⼀般来说，如果Levene⽅差齐性检验的P值⼤于0.05，我们就认为数据符合等⽅差性。从上表可知，本研究中Levene⽅差齐性检验的P值为0.061，⼤于0.05，即任⼀分类都具有等⽅差性，满⾜假设6。

如果⽅差不齐，我们应该如何做呢？

我们可以采取以下4种办法：

(1) 转换数据；

(2) 如果各组样本量⼀致、符合正态性并且⽅差最⼤组与最⼩组的⽐值⼩于3，那么我们认为即使⽅差不齐，也可以尝试采⽤双因素⽅差模型；

(3) 选择更稳健的模型，如⼀般线性模型；

(4) 采⽤加权最⼩⼆乘法回归⽅程。

3.2.5 合并数据

在解释结果之前，我们先来把数据合并，具体操作如下：

(1) 点击Data→Split File

出现下图：

(2) 点击Analyze all cases, do not create groups

(3) 点击OK

结果解释

在解释双因素⽅差分析的结果前，我们需要先进⾏以下分类，再根据分类，采⽤不同的解释⽅法：

(1) 如果⾃变量之间不存在交互作⽤，进⾏主效应分析；

(2) 如果⾃变量之间存在交互作⽤，进⾏简单主效应和交互作⽤对照分析。

4.1 结果判断

wpc总决赛4.1.1 判断是否存在交互作⽤

称赞教学设计

采⽤双因素⽅差分析的⼀个出发点就是判断⾃变量之间是否存在交互作⽤，如本研究中的gender和education_level变量。在进⾏统计检验之前，我们可以通过简图了解⾃变量的交互情况，如下⽰例：

⼀般来说，如果两条线平⾏或即使延长X轴也不会相交，我们就可以初步判断⾃变量之间不存在交互作⽤。但如果两条相交或延长X轴后可能相交，我们就认为⾃变量之间可能存在交互作⽤。

可燃气

本研究中，SPSS输出结果如下：

这两张图都提⽰，本研究中受教育程度与性别可能在对政治兴趣的影响上存在交互作⽤。左上图更为直观，我们就以左上图为例进⾏介绍。

本文发布于:2024-09-20 21:29:56，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/575377.html

上一篇：卫生统计学习题(南医)

下一篇：SPSS学习笔记(三)方差分析ANOVA(F检验)

标签：数据分析检验变量结果

留言与评论（共有 0 条评论）