一、区间估计的概念和步骤
点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。 在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683,落在总体均值范围内的概率是0.955,落在总体均值范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到: 1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。
2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。
一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置信区间。分别为置信区间的下限和上限。称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。
常用的置信度有 0.80,0.90,0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。
图5-2 根据不同样本所得到的置信度为95.5%的置信区间
bbc中国人来了 需要指出的是,P()=不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间[],因此,上述概率可以理解为随机区间[]中包括参数的概率。
图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。
二、单个总体参数的区间估计
(一)正态总体,方差已知,总体均值的区间估计
根据第四章关于样本均值分布的结果,有
~N(0,1)
在给定了估计置信度为时,我们有
我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是
这一置信区间的估计可以用图5-3来表示。
上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数。因此,总体均值的区间估计的公式就变为
图5-3 置信度为的置信区间
菲律宾与中国 从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:
高尔夫球会 1. 计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本均值也必然服从正态分布。
2. 根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数。
独眼喙鼻畸形 3. 计算样本均方差,即抽样的标准误。
4. 最后把上述数据代入公式,得到区间估计的结果。
生产队 其实,这些步骤也同样适用于其他类型的区间估计问题。
(二)非正态总体,方差未知,大样本,总体均值的区间估计
实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。这样样本均值仍服从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当时,我们可用样本标准差来代替总体标准差,直接把S代入上式中的就可以了。
(三)正态总体、方差未知,用小样本对总体均值的区间估计
在总体方差未知的情况下,如果抽取的样本就必须采用其他的估计办法。我们已知服从t分布,其自由度为n-1。因此我们就可以利用t分布来进行估计。此时
与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体规模为N,样本大小为n,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数。
加权平均法 (四)总体比例的区间估计
根据第四章关于样本比例分布的结果,我们有
若样本的比例为,同时规定估计的置信度为,则总体比例的区间估计的公式就是
这里有一个问题,就是在确定总体比例的置信区间时要用到本身,而又恰恰是待估值。但由点估计理论我们知道,样本比例是总体比例P的无偏估计,于是在估计样本比例的方差时,直接用样本比例代替总体比例P。只要样本容量n足够大,并且满足和都大于5就可以保证结果是可靠的。最后,得到总体比例的置信区间为:
当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数。
(五)正态总体方差的区间估计
在第四章关于分布的结果中我们介绍过,来自正态总体的一组样本的方差和总体方差之比服从于分布,即
~
于是对于给定的置信度,我们可以利用分布的特性,查表得到和,则有
于是总体方差的区间估计为
三、两个总体参数的区间估计
(一)两总体均值之差的区间估计
1. 两个正态总体,方差已知,大样本
从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。此时
,
因此,。
由此可以得到,在置信度水平为的情况下,的置信区间为
2. 两正态总体,方差未知,但相等,大样本