第一节-方差分析的基本原理与步骤

第一节 方差分析的基本原理与步骤
方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。
一、线性模型与基本假定
假设某单因素试验有k处理,每个处理有n次重复,共有金属钝化剂nk观测值。这类试验资料的数据模式如表6-1所示。
表6-1加拿大铝业k个处理每个处理有n个观测值的数据模式

处理
观测值
合计
平均
A1
x11
x12
x1j
x1n
A2
x21
x22
x2j
x2n
Ai
xi1
xi2
xij
xin
Ak
xk1
xk2
xkj
xkn
xk.旋转薄膜蒸发器
合计
表中表示第i个处理的第j个观测值(i=1,2,…,kj=1,2,…,n);表示第i个处理n个观测值的和;表示全部观测值的总和;表示第i个处理的平均数;表示全部观测值的总平均数;可以分解为
(6-1)
表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,令
(6-2)
(6-3)

(6-4)
其中μ表示全试验观测值总体的平均数,是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。显然有
(6-5)
εij是试验误差,相互独立,且服从正态分布N(0,σ2)。
(6-4)式叫做单因素试验的线性模型(linearmodel)亦称数学模型。在这个模型中
示为总平均数μ、处理效应αi、试验误差εij之和。由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布Ni,σ2)。尽管各总体的均数可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。
若将表(6-1)中的观测值xiji=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则
(6-6)
与(6-4)式比较可知,分别是μ、(μi-μ)=、(xij-)=的估计值。
(6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μi-μ或),与误差(),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。
二、平方和与自由度的剖分
我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(meansquares)来度量资
料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。
(一)总平方和的剖分在表6-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即

因为

其中
所以(6-7)
(6-7)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即

(6-7)式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即
大村智
于是有
SST=SSt+SSe(6-8)
(6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系式。这个关系式中三种平方和的简便计算公式如下:
(6-9)

其中,C=x2··/kn称为矫正数。
(二)总自由度的剖分在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减一,即kn-1。总自由度记为dfT,即dfT=kn-1。
在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,即dft=k-1。
在计算处理内平方和时,要受k个条件的约束,即i=1,2,…,k)。故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfe,即dfe=kn-k=k(n-1)
因为

所以
(6-10)
综合以上各式得:
(6-11)
各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为(MST或)、MSt(或)和MSe(或)。即
(6-12)
总均方一般不等于处理间均方加处理内均方。
【例6.1】某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
表6-2饲喂不同饲料的鱼的增重(单位:10g)

饲料
鱼的增重(xij)
合计
平均
A1
31.9
27.9
31.8
28.4
35.9
155.9
31.18
A2
24.8
25.7
26.8
27.9
26.2
131.4
26.28
A3
22.1
23.6
27.3
24.9
25.8
123.7
24.74
A4
27.0
30.8
29.0
24.5
28.5
139.8
27.96
合计
=550.8
这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:japanese from voice
矫正数
总平方和

处理间平方和
处理内平方和
总自由度
处理间自由度
处理内自由度
SStSSe分别除以dftdfe便得到处理间均方MSt及处理内均方MSe
因为方差分析中不涉及总均方的数值,所以不必计算之。
三、期望均方
如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即i=1,2,…,k)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21S22,…,S2k都是σ2的无偏估计(unbiasedestimate)量。(i=1,2,…,k)是由试验资料中第i个处理的n个观测值算得的方差。
显然,各的合并方差(以各处理内的自由度n-1为权的加权平均数)也是σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各的合并。

其中SSidfii=1,2,…,k)分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差σ2的无偏估计量。
试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为效应方差,它也反映了各处理观测值总体平均数的变异程度,记为
(6-13)
因为各未知,所以无法求得的确切值,只能通过试验结果中各处理均数的差异去估计。然而,并非的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容:一是各处理本质上的差异即αi(或μi)间的差异,二是本身的抽样误差。统计学上已经证明,+σ2/n的无偏估计量。因而,我们前面所计算的处理间均方MSt实际上是n+σ2的无偏估计量。
因为MSe是σ2的无偏估计量,MStn+σ2的无偏估计量,所以σ2为MSe的数学期望(mathematicalexpectation)n+σ2为MSt的数学期望。又因为它们是均方的期望值(expectedvalue),故又称期望均方,简记为EMS(expectedmeansquares)
当处理效应的方差=0,亦即各处理观测值总体平均数i=1,2,…,k)相等时,处理间均方偏振模散MSt与处理内均方一样,也是误差方差σ2的估计值,方差分析就是通过MStMSe的比较来推断是否为零即是否相等的。

本文发布于:2024-09-21 16:37:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/433708.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:处理   观测   试验   方差   变异   总体   结果
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议