【教学目的】
1.理解抽样推断的含义及特点
2.深刻理解抽样误差产生的原因
3.对抽样误差、抽样平均误差、抽样极限误差加以区别
4.了解各种抽样组织形式的特点
5.重点掌握简单随机抽样组织形式的区间估计方法
【教学重点】
1.理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。 2.理解抽样误差的概念
3.理解和运用不同抽样方法下计算抽样误差
4.掌握简单随机抽样组织形式的区间估计方法
6.掌握必要样本单位数的确定方法
【教学难点】
1.理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。
神秘的白马王子2.理解抽样误差的概念
3.理解和运用不同抽样方法下计算抽样误差
4.掌握简单随机抽样组织形式的区间估计方法
6.掌握必要样本单位数的确定方法
【教学时数】
教学学时为10课时
【教学内容参考】
第一节 抽样推断的意义
一、抽样推断的含义
(一)抽样推断的特点
抽样推断又称为抽样估计,它是在抽样调查的基础上,利用样本实际资料计算样本指标,并据以推算总体相应数量特征的一种统计调查方式。
【案例】
从全国所有股份制企业中,抽取一部分企业,详细调查其生产经营状况,根据这一部分企业的调查资料,来推算所有股份制企业的生产经营状况,这就属于抽样推断。
抽样推断有以下几个特点:
1.按随机原则从总体中抽取调查单位。所谓随机原则是指在抽取调查单位时,总体中每个单位都有同等被抽中的机会,完全排除了人为主观意识的影响,哪个单位抽中与否,纯粹是随机的、偶然的。按随机原则抽取调查单位是进行抽样推论的基本要求。
2.根据被抽取的调查单位,计算各种指标,并对总体的指标作出估计。
3.抽样推断中的抽样误差可以事先计算并加以控制,从而保证抽样推断的结论符合预定的精确度和可靠度要求。
(二)抽样推断的作用
抽样推断的主要作用有:
音箱
1.对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以采用抽样推断方式。另外,对于无限总体也不可能进行全面调查,只能采用抽样推断方式。
2.对于某些不必要或在经济上不允许经常采用全面调查的社会经济现象,最适宜采用抽样
推断方式。
3.对于需要及时了解情况的现象,也经常采用抽样推断方式。因为全面调查浪费人力、物力和财力,资料也不易及时取得,而抽样推断方式不仅节省人力、资金,且时间快,方式灵活,能够及时满足了解情况的需要。
4.对全面调查的资料进行评价和修正。全面调查由于范围广、工作量大、参加的人员多,发生登记性误差的可能性就大。因此,为了保证全面调查资料的准确性,检验全面调查资料的质量,在全面调查之后,一般都要进行抽样推断。在总体中再抽取一部分单位重新调查,然后将两次调查的资料进行比较,计算出差错率,并据此对全面调查的资料加以修正。
5.抽样推断还可以用于工业生产过程中的质量控制。
【能力训练】
下列事项属于抽样推断的有( )。
①为了测定车间的工时损失,对车间中的每三班工人中的第一班工人进行调查。
②为了解某大学食堂卫生状况,对该校的五个食堂进行调查。
③对某城市1%的家庭进行调查,以便研究该城市居民的消费状况。
④对某公司三个分厂中的一个分厂进行调查,以便研究该工厂的能源利用效果。
二、抽样的基本概念
(一)总体和样本
总体又称全及总体。它是根据研究目的,由全部调查单位所组成的集合体。总体的单位数通常都是很大的,甚至是无限的,这样才有必要组织抽样调查,进行抽样推断。总体单位数一般用符号N表示。
样本又称子样。它是从总体中随机抽取出来的部分调查单位所组成的集合体。样本的单位数是有限的。样本单位数一般用符号n表示,也称样本容量。
对于某一特定研究问题来说,作为推断对象的总体是确定的,而且是惟一的。但由于从一个总体中可以抽取许多个样本,所以作为观察对象的样本,不是惟一的,而是可变的。
明白这一点对于理解抽样推断原理是很重要的。
(二)总体指标和样本指标
总体指标又称参数。它是根据总体各单位的标志表现计算的综合指标。
对于总体中的数量标志,可以计算的总体指标有总体平均数、总体方差σ2 (或总体标准差σ)。
设总体变量X的取值为:X1,X2,…则
辉南四中
特雷诺指数 对于总体中的品质标志,由于各单位品质标志不能用数量来表示,因此,可以计算的总体指标有总体成数、总体成数方差或总体成数标准差σP)。
设P表示总体中具有某种性质的单位数在总体单位数中所占的比重,Q表示总体中不具有某种性质的单位数在总体单位数中所占的比重。在总体N个单位中,有N1 个单位具有某种性质,N0 个单位不具有某种性质,N=N1 +N0 。则
如果总体中的品质表现只有“是”、“非”两种。例如,产品质量的标志表现为合格和不合格,人口性别的标志表现为男性和女性,则可以把“是”的标志表现表示为1,而“非”的标志表现表示为0。那么成数P就可以视为(0,1)分布的相对数,并可以计算相应的方差(或标准差)。其计算公式为
在抽样推断中,总体指标的意义和计算方法是明确的,但总体指标的具体数值事先是未
知的,需要用样本指标来估计它。
样本指标又称统计量。它是根据样本各单位的标志表现计算的、用来估计总体指标的综合指标。可以计算的样本指标有样本平均数、样本方差s2和样本成数P等。
设样本变量x的取值为x1,x2,…xn,则
民商法论丛
在抽样推断中,样本指标的计算方法是确定的,但它的取值随着样本的不同,有不同的样
本变量。所以,样本指标本身是随机变量,用它作为总体指标的估计值,有时误差大些,有时误差小些;有时产生正误差,有时产生负误差。
【能力训练】
总体指标和样本指标( )。
①都是随机变量
②都是确定性变量
③前者是惟一确定的,后者是随机变量④前者是随机变量,后者是惟一确定的
三、抽样方法
在抽样调查中,从总体中抽取样本单位的方法有两种:重复抽样和不重复抽样。
(一)重复抽样
重复抽样也称重置抽样、放回抽样、回置抽样等。它是指从总体N个单位中随机抽取容
量为n的样本时,每次抽取一个单位,把结果登记下来后,重新放回,再从总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有被重复抽中的机会。可见,重复抽样的总体单位在各次抽取中都是不变的,每个单位中选的机会在每次抽取中都是均等的。
用重复抽样的方法从总体N个单位中抽取n个单位组成样本,可能得到的样本总数为Nn个。
(二)不重复抽样
不重复抽样也称不重置抽样、不放回抽样、不回置抽样等。它是指从总体N个单位中随机抽取容量为n的样本时,每次抽取一个单位后,不再放回去,下一次则从剩下的总体单位中继续抽取,如此反复,最终构成一个样本。也就是说,每个总体单位至多只能被抽中一次,所以从总体中每抽取一次,总体就少一个单位。因此,先后抽出来的各个单位被抽中的机会是不相等的。
用不重复抽样的方法从总体N个单位中抽取n个单位组成样本,可能得到的样本总数为。不考虑顺序的组合数为。
可见,在相同样本容量的要求下,不重复抽样可能得到的样本个数比重复抽样可能得到的样本个数少。当采用不重复抽样、而全及总体所包含的单位数又不多时,越到后来,留在总体中的单位就越少,被抽中的机会就越大。不过当全及总体单位数很多、样本总体单位数所占的比重很小时,则对先后抽出来的各个单位被抽中的机会影响不大。由于不重复抽样简便易行,所以在实际工作中经常被采用。
第二节 抽样误差
一、抽样误差的含义
在抽样推断中,用样本指标推断总体指标,总会存在一定的误差,其误差来源主要有两个方面:
(一)登记性误差
即在调查和整理资料的过程中,由于主、客观因素的影响而引起的误差,如在登记的过程中由于疏忽而将3误写为8,将1误写为7;在计算合计的过程中所造成的计算错误等。
(二)代表性误差
即由于样本的结构情况不足以代表总体特征而导致的误差。代表性误差的产生又有两种情况:
一种是违反了抽样推断的随机原则,如调查者有意地多选较好的单位或多选较差的单位来进行调查,这样计算出来的样本指标必然出现偏高或偏低的情况,造成系统性误差,也称为偏差。
另一种情况是遵守了抽样推断的随机原则,但由于从总体中抽取样本时有多种多样的可能,当取得一个样本时,只要被抽中样本的内部结构与被研究总体的结构有所出入,就会出现或大或小的偶然性的代表性误差,也称为随机误差。
系统性误差和登记性误差都是由于抽样工作组织不好而导致的,应该采取预防措施避免发生。而偶然性的代表性误差是无法消除的。抽样误差就是指这种偶然性的代表性误差,即按随机原则抽样时,单纯由于不同的随机样本得出不同的估计量而产生的误差。
抽样误差是抽样推断所固有的,虽然它无法避免,但可以运用大数定律的数学公式加以精确地计算,确定其具体的数量界限,并通过抽样设计加以控制。所以这种抽样误差也称为可控制误差。
【能力训练】
抽样误差是( )。
①样本数目过少引起的
②观察、测量、计算的失误引起的
③抽样过程中的偶然性因素引起的
④抽样推断中产生的系统性误差
二、抽样平均误差
(一)抽样平均误差的含义
抽样误差描述了样本指标与总体指标之间的离差绝对数,在用样本指标估计相应的总体指标时,它可以反映估计的准确程度。但是由于抽样误差是随机变量,具有取值的多样性和不确定性特点,因而就不能以它的某一个样本的具体误差数值来代表所有样本与总体之间的平均误差情况,应该用抽样平均误差来反映抽样误差平均水平。
所谓抽样平均误差,就是所有可能出现的样本指标(平均数或成数)的标准差,也可以理解为所有的样本指标与总体指标之间的平均离差。我们所说的抽样误差可以事先计算和控制,就是针对抽样平均误差而言的。抽样平均误差是用样本指标推断总体指标时,计算误差范围的基础。
抽样平均误差的计算,与抽样方法和抽样组织形式有直接关系,不同的抽样方法和抽样组织形式计算抽样平均误差的公式是不同的。
(二)抽样平均误差的计算
在实际工作中,只求得一个样本指标,无法得到抽样平均误差(即样本指标的标准差),因而常常是根据抽样平均误差和总体标准差的关系来推算。样本平均数的抽样平均误差计算公式如下:
在一般情况下,总体平均数是未知的。当样本较多时,可用样本平均数的平均数来代替(这已经得到证明)。而在实际工作中,通常只需从总体中抽取一个样本,这样就可以根据总体标准差和样本单位数的关系来计算。