统计案例分析
姓名: 覃玉冰
学号:
班级: 16应用统计
一、数据
为了了解大学生日常生活费支出及生活费来源状况,对中国人民大学在校本科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、大二、大三、大四在校本科生男女各30多人作为样本。调查采取分层抽样,对在校本科生各个年级男生、女生各发放问卷30多份,共发放问卷300份,回收问卷291份,其中有效问卷共272份。其中,男生的有效问卷为127份,女生为145份。调查得到的部分数据见表一。 表一 大学生月平均生活费支出的调查数据(仅截取部分)
性别 | 所在年级 | 家庭所在地区 | 平均月生活费(元) | 性别 | 所在年级 | 家庭所在地区 | 平均月生活费(元) |
男 | 1998级 | 大型城市 | 1000 | 女 | 1998级 | 大型城市 | 500 |
男 | 1998级 | 大型城市 | 800 | 女 | 1998级 | 大型城市 | 800 |
男 | 1998级 | 大型城市 | 1000 | 女 | 1998级 | 大型城市 | 500 |
男 | 1998级 | 中小城市 | 400 | 女 | 1998级 | 大型城市 | 1000 |
| | | | | | | |
二、生活费支出的区间估计和假设检验
(一)平均月生活费的描述统计量
为了更好地研究全校本科学生平均月生活费支出,我们先来看一下样本数据中平均月生活费支出的一些描述统计量。
在spss中,点分析→描述统计→描述→变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述统计量见表二。 教育财会研究表二 平均月生活费的描述统计量
| N | 均值 | 标准差 |
统计量 | 统计量 | 标准误 | 统计量 | 生物气溶胶
平均月生活费 | 272 | 595.04 | 14.761 | 243.444 |
有效的 N (列表状态) | 272 | | | |
| | | | |
从表二可以看到,样本数据中平均月生活费支出的均值为595.04,标准差为243.444,均值的标准误为14.761.
(二)平均月生活费的假设检验
从表二中我们已经知道了样本数据中平均月生活费支出的均值为595.04,现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于500。
1. 检验统计量的确定
二氧化碳回收
样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,如果总体为正态分布,样本统计量服从正态分布:如果总体为非正态分布,样本统计量也是渐进服从正态分布的。所以在这种情况下,我们都可以把样本统计量视为正态分布,这时可以使用z统计量(z分布)。即在总体标准差已知时,有而我们这里总体标准差是未知的,此时可以用样本标准差s代替,上式可以写为:
2. 提出假设
原假设为:全校本科学生月平均生活费支出u=500
备择假设为:全校本科学生月平均生活费支出u=500全国能源工作会议
3. spss操作及结果分析
在spss中点分析→比较均值→单样本T检验→检验变量选“平均月生活费”→检验值填“500”,得到的平均月生活费的假设检验的结果见表三。
表三 平均月生活费的假设检验的结果
| 检验值 = 500 |
t | df | Sig.(双侧) | 均值差值 | 差分的 95% 置信区间 |
下限 | 上限 |
平均月生活费 | 6.438 | 271 | .000 | 方立天95.037 | 65.98 | 124.10 |
| | | | | | |
从表三可以看到,检验的P值接近于0,其小于0.05,根据小拒大接的原则,拒绝原假设,表面全校学生的月平均生活费支出与500元有显著差异。
(三)平均月生活费的区间估计
1. 数学模型的建立
样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为。经过标准化以后的随机变量服从标准正态分布,即
由上式和正态分布的性质,可以得出总体均值在置信水平下的置信区间为
式中,称为置信下限,称为置信上限;是事先所确定的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率;称为置信水平;是标准正态分布右侧面积为时的值;是总体均值的标准误;是估计总体均值时的估计误差。
这里,我们并不知道全校本科学生的平均月生活费支出的方差,但是由于样本数据的样本量较大,所以上式中的总体方差可以用样本方差代替,这时总体均值在置信水平下的置信区间可以写为:
2.模型的求解
由表二可知,样本均值为595.04,样本均值的标准误为14.761.当风险值取0.05时,即置信水平取95%时,全校学生月平均生活费支出的95%的置信区间为[595.04-1.96*14.761,595.04+1.96*14.761],即566.11到623元之间。
三、男女学生的平均月生活费的假设检验
(一)男女学生的平均月生活费的描述统计量
为了更好地研究全校本科男女学生的平均月生活费支出间是否有显著差异,我们先来看一下样本数据中男女学生的平均月生活费支出的一些描述统计量。
在spss中点数据→拆分文件→勾选“比较组”→分组方式选“性别”
然后点分析→描述统计→描述→变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的平均月生活费的描述统计量见表四。
表四 男女学生平均月生活费的描述统计量
性别 | N | 均值 | 标准差 |
统计量 | 统计量 | 标准误 | 统计量 |
男 | 平均月生活费 | 127 | 569.69 | 20.387 | 229.748 |
有效的 N (列表状态) | 127 | | | |
女 | 平均月生活费 | 145 | 617.24 | 21.056 | 253.543 |
有效的 N (列表状态) | 145 | | | |
| | | | | |
从表四可以看到,样本数据中男生的平均月生活费支出的均值为596.69,标准差为229.748;女生的平均月生活费支出的均值为617.24.标准差为253.543。单从样本数据中男女学生的平均月生活费支出的均值来看,全校本科男女学生的平均月生活费支出间是有差异的,但是这只是我们主观的看法,下面我们用两个总体均值之差的假设检验来探究全校本科男女学生的平均月生活费支出间是否有显著差异。用友nc什么意思
(二)男女学生的平均月生活费间的假设检验
1. 检验统计量的确定
样本数据中男学生有127人,女学生有145人,均大于30,说明两个总体的样本量均较大,此时无论两个总体的分布是不是正态分布,可以证明的是,由两个独立样本算出来的的抽样分布都是服从正态分布的,此时,作为检验统计量的计算公式为: