案例辨析及参考答案
案例9-1 有研究者以“正常血糖、糖耐量减低及2型糖尿病人胰岛素抵抗与非酒精性脂肪肝的相关分析”为题,研究了非酒精性脂肪肝的患病率与糖尿病分级(即正常血糖、糖耐量减低和2型糖尿病三级)的关系。以正常血糖者、糖耐量减低者和2型糖尿病患者为研究对象,年龄、性别可比,无大量饮酒史、肝炎史,脂肪肝的诊断以影像学结果为准。指标以均数±标准差表示,统计分析采用两组独立样本比较的t检验。结果发现,三组血糖、胰岛素、血脂水平等和脂肪肝患病率差别有统计学意义(数据及统计结果见教材表9-7),糖耐量减低组与正常血糖组比较P<0.05,2型糖尿病组与糖耐量减低组比较P<0.05。结论,随着正常血糖向糖耐量减低及糖尿病发展,血糖、血脂、胰岛素抵抗指数及脂肪肝患病率等指标值皆升高并逐渐加重,差异有统计学意义,认为脂肪肝患病率与血糖水平、血胰岛素、血脂、胰岛素抵抗、糖耐量减低和2型糖尿病等成正相关。 教材表9-7 三种血糖水平人的血生化及脂肪肝患病率
组别 | 聚氨酯改性环氧树脂例 | 血糖/ | 胰岛素/ | 三酰甘油/ | 总胆固醇/ | 胰胰素 抵抗指数/ | 脂肪肝患病率/% |
空腹 | 餐后 | 空腹 | 餐后 |
正常血糖 | 87 | 5.0±0.5 | 5.6±1.0 | 7.4±1.8 | 24±8 | 0.9±0.3 | 3.0±0.9 | 0.6±0.5 | 48.3 |
糖耐量减低 | 62 | 6.5±0.5 | 8.2±1.3 | 11.4±2.7 | 134±58 | 2.1±1.0 | 4.6±0.8 | 1.2±0.7 | 69.4 |
2型糖尿病 胃肠动力 | 68 | 8.3±2.6 | 12.5±3.4 | 16.8±3.2 | 114±44 | 2.6±1.5 | 5.1±0.8 | 1.9±0.7 | 83.8 |
| | | | | | | | | |
经检验,糖耐量减低组与正常血糖组比较,以及2型糖尿病与正常血糖组比较,各指标比较的值均<0.01;而2型糖尿病与糖耐量减低组比较,餐后胰岛素两组比较<0.05,脂肪肝患病率比较<0.05,其余各指标比较的值均<0.01。
请问:该研究的目的与设计方法吻合吗?该研究设计属于何种类型?有无更好的设计方案?本设计最适合哪种统计分析法?本例的统计分析方法有何不妥?本例的统计分析结果能推出本例的结论吗?若否,则可以推出什么结论?本例的统计表达有何不妥吗?
案例辨析 这里,题目是“相关分析”,结果也得到了“相关”的结果,但仔细分析其研究内容与统计学方法,发现其测量了三组人的血糖、血脂和脂肪肝患病率,这样的设计属于多组比较的设计,不能达到相关分析的目的,最多只能认为研究的结局指标与分组因素“有关”。
正确做法 欲进行相关分析,必须从特定人(如正常人或糖耐量减低但未患糖尿病的人或2型糖尿病患者)中抽取一组随机样本,直接采用Pearson相关分析研究定量观测指标血糖、胰岛素、血脂水平等之间的相关关系;若希望研究以上三个人之间血糖、胰岛素、血脂水平等与脂肪肝患病率之间的关系,应采用较复杂的统计分析方法(如多重logistic回
归分析)处理,此处从略。
案例9-2 有研究者欲评价两种量表对某疾病的严重程度得分的一致性,评分者A用量表1,评分者B用量表2,对同一批患者(5人)进行了评分,结果见教材表9-8,研究者在Excel中采用Pearson函数计算了两次评分的相关系数,结果两者相关系数非常之高(r=0.866 3),因此认为,两种量表得分是一致的。
教材表9-8 两种量表评分的结果
量表 | 评分人 | 患者1 | 患者2 | 患者3 | 患者4 | 漯河日报社 患者5 |
1 | A | 86 | 90 | 73 | 88 | 78 |
2 | B | 45 | 47 | 39 | 42 | 40 |
| 固原市回民中学 | | | | | |
请问:该研究的目的与设计方法吻合吗?就本例的设计而言,存在任何不妥吗?本例可否采用Pearson相关系数进行计算?计算的结果正确吗?推论正确吗?
案例辨析 在本例中,突出的问题有两个。第一个问题是样本量太小,只有5人,难以得出
有统计学意义的结论。查表得知,当样本量只有5时,自由度为3,此时在的水平要得到有统计学意义的相关系数值的最低界限是0.878,本例系数为0.86,尚未达到有统计学意义的临界值,原研究者必定是对相关系数未作假设检验而妄下断论。第二个问题是以“相关”推断“一致”。实际上,“相关”与“一致”有本质的区别。“相关”可以是不同指标间的相关,可以正相关,可以负相关,只表示变量间的联系,而“一致”则是同指标间同方向且基本同值的概念。令,则间相关系数为1,但它们并不一致,在不考虑截距项的前提下,增加1倍,平均增加2倍。实际研究中也有这样的例子,如仪器未校正时与校正后的数据,两者相差一个系统误差,但相关系数为1。
正确做法 ①增加样本量。②将同一病人的两份量表评分总分视为X、Y两变量的取值,采用后面将要讲到的简单线性回归分析方法处理,进行回归参数假设检验时,应检验总体截距是否等于0、总体斜率是否等于1。③对两份量表的分级的符合性进行Kappa系数分析。
案例9-3 有研究者欲研究某药口服量与血药浓度关系,把口服药物设定为1, 2.5, 5, 7.5, 10, 15, 20, 30等档次,每档各取3只动物(共24只)进行试验,于服药后1 h抽血检验血药浓度(教材表9-9)。在SPSS中作散点图(教材图9-4),计算得口服药物量与血药浓度的Pea
rson相关系数=0.979,经假设检验P<0.001,认为口服药物量与血药浓度呈线性正相关。
教材表9-9 不同口服量与相应血药浓度
青鸟网 口服量/mg | 1 | 1 | 1 | 2.5 | 2.5 | 2.5 | 5 | 5 | 5 | 7.5 | 7.5 | 7.5 |
血药浓度/ | 0.3 | 0.4 | 0.3 | 0.6 | 0.6 | 0.7 | 1.0 | 1.0断肠猿 | 1.1 | 1.8 | 1.9 | 2.0 |
口服量/mg | 10 | 10 | 10 | 15 | 15 | 15 | 20 | 20 | 20 | 30 | 30 | 30 |
血药浓度/ | 2.8 | 3.0 | 3.0 | 4.5 | 4.5 | 4.3 | 8.3 | 8.0 | 7.8 | 15.2 | 14.2 | 13.8 |
| | | | | | | | | | | | |
教材图9-4 药物口服量与血药浓度关系的散点图
请问:本例的两个变量各有何特征?可以计算Pearson相关系数吗?若可以,则计算的方法与步骤有何不妥吗?计算结果正确吗?可以推出本例的结论吗?
案例辨析 本例的重要问题是,线性相关的条件不满足,即口服剂量是人为取定的,属于非随机变量,因此不宜作相关分析。其次,仅利用Pearson相关系数与假设检验值就认为两者呈线性正相关为时过早。分析本例的散点图,可发现散点呈曲线形,而非直线型,因此
即使口服剂量是随机变量也不宜直接作线性相关分析。第三,研究者取的剂量范围为1~30,而结论认为口服药物量与血药浓度呈线性正相关,未限定浓度范围,也是不妥的。相关分析很重要的一条就是在多大范围作的研究就在多大范围下结论,因为超过范围很可能结论就不再成立。
正确做法 ①若要进行相关分析,则应将浓度随机化,不可定点;②认真分析散点图,看其散点分布趋势,因是曲线形,因此宜在适当变换(如对数变换等)后作线性相关分析。