(完整版)《医药数理统计方法》学习指导-标准答案

第一章 数据的描述和整理
一、学习目的和要求
1. 掌握数据的类型及特性;
2.掌握定性和定量数据的整理步骤、显示方法;
3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;
4.能理解并熟练掌握样本均值、样本方差的计算;
5.了解统计图形和统计表的表示及意义;
6。 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要
(一)数据的分类
数据类型
定性数据(品质数据)
定量数据
定类数据
(计数数据)
定序数据
(等级数据)
数值数据
(计量数据)
表现形式
类别
(无序)
类别
(有序)
数值
(×÷
对应变量
定类变量
定序变量
数值变量
(离散变量、连续变量)
主要统计方法
计算各组频数,进行列联表分析、 2检验等非参数方法
计算各种统计量,进行参数估计和检验、回归分析、方差分析等参数方法
常用统计图形
条形图,圆形图(饼图)
直方图,折线图,散点图,
茎叶图,箱形图
(二)常用统计量
1、描述集中趋势的统计量
名 称
公 式(原始数据)
公 式(分组数据)
意 义
均值
反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,
中位数
Me
中位数所在组:
累积频数超过n/2的那个最低组
是典型的位置平均数,不受极端值的影响
众数
Mo
数据中出现次数最多的观察值
众数所在组:
频数最大的组
测度定性数据集中趋势,对于定量数据意义不大
2、描述离散程度的统计量
名 称
公 式(原始数据)
公 式(分组数据)
意 义
极差
R
R = 最大值-最小值
R≈最高组上限值-最低组下限值
反映离散程度的最简单测度值,不能反映中间数据的离散性
总体方差
2
反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值, 其中标准差具有与观察值数据相同的量纲
总体标准差
样本方差
S2
反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值, 其中标准差具有与观察值数据相同的量纲
样本标准差S
变异系数
CV
CV=
反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度
样本标准误
反映样本均值偏离总体均值的平均程度,在用样本均值估计总体均值时测度偏差
3、描述分布形状的统计量
名 称
公 式(原始数据)
公 式(分组数据)
意 义
偏度
Sk
反映数据分布的非对称性
Sk=0时为对称;
Sk >0时为正偏或右偏;
Sk 〈0时为负偏或左偏
峰度
Ku
(原始数据)
(分组数据)
反映数据分布的平峰或尖峰程度
Ku=0时为标准正态;
Ku汤永涛>0时为尖峰分布;
Kuimpreza wrx<0时为扁平分布
* 在分组数据公式中,mi fi分别为各组的组中值和观察值出现的频数。
三、综合例题解析
第三种温暖
例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C,有
证一:设                 
由函数极值的求法,对上式求导数,得
f C)=0,得唯一驻点
由于,故当f (C)y有最小值,其最小值为
证二:因为对任意常数C有
故有                   
四、习题一解答
1.在某药合成过程中,测得的转化率(%)如下:
94。3  92。8  92。7  92。6  93.3  92.9  91。8  92.4  93。4  92.6
92.2  93.0  92。9  92.2  92。4  92.2  92。8  92。4  93。9  92。0
93.5  93。6  93.0  93.0  93.4  94。2  92.8  93.2  92.2  91。8
92。5  93.6  93。9  92。4  91.8  93.8  93.6  92.1  92。0  90。8
(1)取组距为0。5,最低组下限为90。5,试作出频数分布表;
(2)作频数直方图和频率折线图;
(3)根据频数分布表的分组数据,计算样本均值和样本标准差.
解:(1)所求频数分布表
转化率的频数分布表
转化率分组
频数
频率
累积频率
90。5~
1
0。025
0.025
91.0~
0
0。00
数理统计法
0。025
91.5~
3
0.075
0。10
92。0~
11
0。275
0。375
92。5~
9
0。225
0。60
93.0~
7
0。175
0.775
93。5~
7
0.175
0。95
94。0~94.5
2
0。05
1。00
(2)频数直方图
频率折线
(3)由频数分布表可得
电桥平衡
转化率分组
组中值mi
频数
90.5~
90。75
1
91.0~
91.25
0
91.5~
91。75
3
92.0~
92。25
11
92.5~
92。75
9
93.0~
93。25
7
93。5~
93.75
7
94.0~94。5
94。25
2
则   
=[(90。75-92。8252×1+(91.25-92.825)2×0+…+(94。25-92。8252×2gal芯片
=0。584
或者 
=0。7642
2.测得10名接触某种病毒的工人的白细胞(109/L)如下:
7.1,6。5,7。4,6。35,6。8,7。25,6.6,7.8,6。0,5.95
(1)计算其样本均值、方差、标准差标准误和变异系数
(2)求出该组数据对应的标准化值;
(3)计算其偏度。
解:(1),n=10
462.35
样本均值
方差
标准差=0。609
标准误
变异系数CV===8.99%;
(2)对应的标准化值公式为
对应的标准化值
0.534,—0。452,1。026,-0。698,0。041,0.78,-0。287,1。683,-1.273,-1.355;
(3)=0.204。
3。 已知某年某城市居民家庭月人均支出分组数据如下表所示
按月人均支出分组(元)
家庭户数占总户数的比例(%)
200以下
200~
500~
800~
1000以上
1。5
18。2
46.8
25.3
8。2
合计
100
试计算(1)该市平均每户月人均支出的均值和标准差;
(2)并指出其月人均支出的中位数与众数所在组。
解:(1)由原分组数据表可得
支出分组(元)
组中值
比例(%)
200以下
200
500
800
1000以上
100
350
650
900
1100
1.5
18.2
46.8
25。3
8。2
则   
   
    (2)由原分组数据表可得
支出分组(元)
比例(%)
累积比例(%)
200以下
200
500
800~
1000以上
1.5
18.2
46。8
25。3
8。2
1。5
19。7
66.5
91。8
100

本文发布于:2024-09-20 15:28:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/694026.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   统计   频数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议