《卫生统计学》课程考试(A卷)
一、名词解释(每题3分,共30分)
1. 均数标准误
2. power of test
3. 同质
4. 确定系数
5. 简单线性回归分析
6. 生存分析
7. 随机区组设计
8. 交互效应
10.type I error
二、单选题(每题1分,共20分)
1.以下关于抽样误差,错误的是____________。 A.抽样研究中,抽样误差是不可避免的
B.抽样误差是由于抽样的随机性造成的
D.对于同一总体的若干样本统计量间,也存在抽样误差
E.抽样误差的大小可用标准误来说明
2.比较20头河马体重和20只小白鼠体重两组数据变异程度大小宜采用 。
A. 变异系数(CV)
B. 方差(S2 )
C. 极差(R)
D. 标准差(S)
E. 四份位数间距
3.某厂男职工 370 人,女职工 456 人,慢性苯中毒人数男女分别为 8 和 10 人,(456/370)×100%为 。
A.率
B.构成比
C.相对比
D.平均率
E.标化患病比
4.两样本均数比较时,分别取以下检验水准,以________所对应的第二类错误最小。 A.α=0.01
B.α=0.05
C.α=0.10
D.α=0.20
E.α=0.25
5.有一组某地居民1950~1968 年伤寒与结核病死亡率(1/10 万)资料,下列哪种统计图可以形象化地反映两种疾病的死亡率随着时间推移的变化速度: 。
A.条图或圆图
B.直方图
C.散点图
D.普通线图
E.半对数线图
6.关于检验假设,下面哪项说法是错误的 。
A.检验假设是对总体作的某种假定
B.在研究设计阶段对单侧检验还是双侧检验作出规定
C.检验假设与备择假设是对立的
D.检验假设与备择假设地位是相等的
E.检验结果若P值大于0.05,则接受H0犯错误的可能性很小
7.经调查获知甲乙两地的冠心病粗死亡率均为4/105,经统一年龄构成后,甲地标化率为4.5/105,乙地为3.8/105。因此认为:____ _。
A. 甲地人较乙地年轻
B. 乙地人较甲地年轻
C. 甲地的诊断较乙地准确
D. 乙地的诊断较甲地准确
E. 标化率符合实际
8.以下关于可信区间,正确的是_________。
A.可信区间是包含未知总体参数的一个范围
B.可信区间包含可信区间上下限两个值
C.可信区间的确切含义是指有(1-α)的可能认为计算出的可信区间包含了总体参数
D.可信区间的确切含义也可理解是总体参数落在该范围的可能性为 1-α
E.以上说法均不对
9.在比较两样本均数的假设检验中,结果t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。正确的结论是 。
A.两样本均数不同
B中生菌素.两样本均数差异很大
C.两总体均数差异很大
D.两样本均数来自同一总体
E.两样本均数来自不同总体
10.对四格表资料作2 检验时,若有一个实际数字为0,则 。
A.不能作2 检验
B.必须用校正2 检验
C.还不能决定是否可计算2 统计量作检验
D.不必计算校正混合糖电解质注射液2 统计量
E.还不能确定是否需要作校正
11.用某中草药预防流感,其用药组与对照组的流感发病情况如下表:
组别 | 观察人数 | 发病人数 | 发病率(%) |
用药组 | 100 | 14 | 14 |
对照组 | 120 | 30 | 25 |
| | | |
则构成四格表的四个格子内的数字是 。
A. | amoisonic 100 | 14 | B. | 100 | 14 | C. | 100 | 86 | D. | 14 | 86 | E. | 14 | 14 |
120 | 30 | 120 | 25 | 120 | 90 | 30 | 90 | 30 | 25 |
| | | | | | | | | | | | | | |
12. 完全随机设计资料的方差分析中,有______。
A. B.
C. D. E.
13. 对k个处理组,b个随机区组资料的方差分析,其误差的自由度为______。
A. kb–k–b B. kb–k–b–1 C. kb–k–b–2
D. kb–k–b+1 E. kb–k–b+2
14.四种基本的概率抽样方法为______。
A.系统抽样、整抽样、偶遇抽样、简单随机抽样
B.单阶段抽样、多阶段抽样、雪球抽样、便利抽样
C.简单随机抽样、分层抽样、整抽样、配额抽样
D.简单随机抽样、分层抽样、系统抽样、整抽样
E.多阶段抽样、分层抽样、系统抽样、机械抽样
15. 两因素析因设计资料的方差分析中,存在______。
A. B.
C. D.
E.
16. 在以下关于非参数检验的叙述中,不正确的是____。
A.一般不直接对样本观察值进行分析。
B.对不清楚是否适合于参数检验的资料,应采用非参数检验。
C.对于难以确定分布,又出现少量异常值的小样本数据,应采用非参数检验。
D.非参数检验结论的稳健性之好,可由剔除数据中异常值前后结论的一致性显示出。
E.非参数检验具有广泛的适用性,因此而成为通常情况下的首选检验方法。
17. 不属于基于秩次的非参数检验的方法是____。
A.单样本的符号秩和检验
B.配对设计资料的符号秩和检验
C.两组独立样本比较的秩和检验
D.多组独立样本两两比较的秩和检验
E.多组独立样本比较的秩和检验
18. 在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明____。
A.X 对 Y 的影响占Y 变异的 30%
B.X 增加一个单位,Y 平均减少 30%
C.X 增加一个单位,Y 平均减少 0.30 个单位
D.Y 增加一个单位,X 平均减少 30%
E.Y 增加一个单位,X 平均减少 0.30 个单位
19. 如果直线相关系数=1,则一定有____。
A.SS总=SS残
B.SS残=SS回
C.SS总=SS回
D.SS总>SS回
E.以上都不正确
20. 在直线回归中,如果自变量X乘以一个不为0且不为1的常数,则有____。
A.截距改变
B.回归系数改变
thinkcentre m7100z
C.两者都改变
D.两者都不改变
E.以上情况都可能
三、简答题(共30分)
1. 请简述假设检验与区间估计的区别与联系。(7分)
2. 线性回归模型的适用条件。(7分)
3. 回归中个体Y值的预测带。(8分)
4. 简述实验设计的原则,并解释遵循这些原则的理由。(8分)
四、计算分析题(20分)
1. 用两种方法检验已确诊的肝癌患者120名,得到如下资料。
(1)请解释表中42、18两个数字的意义。(2分)
(2)请通过2 检验说明两种方法检查的阳性检出率有无差别。(6分)
表1 整理表格
甲法 | | 乙法 | 合计 |
+ | - |
+ | 42 | 30 | 72 |
- | 18 | 科技进步奖30 | 48 |
| 合计 | 60 | 60 | 120 |
| | | | |
2.为研究三种不同处理下大白鼠血糖浓度随室温(℃)的变化,抽取条件相同或相近的24只大白鼠随机分配于三种不同处理的八种室温下进行实验,结果见表2。
表2 不同处理及不同室温下大白鼠的血糖浓度(g/L) |
处理 | 0℃ | 5℃ | 10℃ | 15℃ | 20℃ | 25℃ | 30℃ | 35℃ |
A | 0.98 | 0.96 | 1.10 | 1.08 | 1.20 | 1.25 | 1.40 | 1.45 |
B | 0.86 | 0.80 | 1.00 | 1.16 | 1.15 | 1.30 | 1.20 | 1.40 |
帝喾C | 0.90 | 0.95 | 0.98 | 1.20 | 1.22 | 1.36 | 1.35 | 1.50 |
| | | | | | | | |
请填写表3数据,并回答三种处理的血糖浓度是否不同?八种室温的血糖浓度是否不同?(12分)
表3 随机区组资料方差分析表
变异来源 | | | | | |
处理组 | 0.0272 | ③ | ⑥ | ⑨ | 0.042 |
区 组 | ① | ④ | 0.0136 | ⑩ | 0.000 |
误 差 | ② | ⑤ | ⑦ | | |
总变异 | 0.8986 | 23 | ⑧ | | |
| | | | | |
卫生统计学试题(A卷)答案及评分标准
一、名词解释(每题3分,共30分)
1. 均数标准误:它反映样本均数间的离散程度,也反映样本均数和相应总体均数间的差异,说明了均数抽样误差的大小。
2. power of test:检验效能(1分),用概率1-β表示,其中β为假设检验不拒绝H0时犯Ⅱ类错误的概率。其意义是,当两总体确有差别,按检验水准α,假设检验能发现其差别(拒绝H0)的能力。(2分)
3. 同质:是指同一总体中个体的性质、影响条件和背景相同或非常相近。
4. 确定系数: 回归平方和与总离均差平方和之比称为确定系数, 取值在0到1之间,且无单位。它反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的部分所占的比例。(3分)
5. 简单线性回归分析: 是描述因变量(Y)如何依赖于自变量(X)的变化而发生线性变化的规律性的一种统计分析方法。 (3分)
6. 生存分析:是将终点事件的是否出现与观察对象到达终点所经历的时间长短结合起来分析的一类统计学分析方法。(3分)
7. 随机区组设计: 它通常是将受试对象按性质(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)相同或相近者组成b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象分别随机分配到k个处理组中去。
8. 交互效应: 当某因素的各单独效应随另一因素水平不同而变化时,则称这两个因素间存在交互效应。
9. 可信区间又称置信区间,是按给定概率(1-)由样本估计未知总体参数的可能取值范围。(2分)
10.type I error Ⅰ型错误或1类错误(1分),当H0为真时,检验结果却拒绝H0,而接受H1,则犯I型错误,其大小记为α。(2分)
二、单选题
1.D 2.A 3.C 4.E 5.E 6.E 7.A 8.C 9.E 10.C
11.D 12.A 13.D 14.D 15.E 16.E 17.D 18.C 19.C 20.D
三、简答题
1.请简述假设检验与区间估计的区别与联系。(7分)
一方面,可信区间可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。(2分)
另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。(2分)
虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率——检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。(3分)
2. 线性回归模型的适用条件:(1) 因变量Y与自变量X呈线性(linear)关系;(2) 每个个体观察值之间相互独立;(3) 在一定的范围内,与任意给定X值相对应的随机变量Y的值服从正态分布;(4)在一定的范围内,各X值所对应的随机变量Y值的方差相等。(7分)