基本的统计原理及适用范围

标准差与变异系数的应用：标准差与变异系数都是用来描述定量资料变量值间变异程度或离散趋势的指标，在应用上，应注意两者的差别。

标准差：两组数据比较时，若两组资料（总体或样本）度量单位相同，均数相等或相近的条件下，应用标准差。标准差越大，说明变量的变异度越大，即各变量值越分散（较远离均数），因而均数对该组变量值的代表性越差，反之，标准差越小，说明变异度越小，即各变量值较集中在均数周围，因而均数对各变量值的代表性越好。

变异系数：当我们遇到两组观察值的度量单位不同时，或两组资料的均数相差悬殊，比较其变异程度时，不能用标准差而用变异系数比较变异程度或离散趋势的大小。

标准差与标准误标准误是样本均数的标准差，标准误与标准差呈正比关系。

（1）意义：标准差是描述离散趋势的指标。标准差可以表示一组观察值分布的离散程度和衡量均数的代表性。若两组资料（总体或样本）的度量单位相同，均数相近的条件下，标准差越大，说明变量的变异性越大，即各变量值越离散（较远离均数），因而均数对该组变量值的代表性越差，反之；标准差越小，说明变异度越小，即各变量值较集中在均数周围，因而均数对各变量值的代表性较好。

标准误是反应抽样误差大小的指标。均数标准误大，说明抽样误差大，表示样本均数离总体均数越远，用样本均数估计总体均数的可靠性越小，反之；标准误越小，说明抽样误差小，表示样本均数离总体均数越近，用样本均数估计总体均数的可靠性越大。

（2）应用：标准差与均数结合，用以描述个体观察值的分布范围，常用于医学参考值范围的计算。标准误与均数结合，用以估计总体均数可信区间的范围。

（3）湖南师范大学学报与样本含量的关系：随着样本含量的增加，标准差趋于稳定。样本含量越大，标准误越小。

方差分析

方差分析的基本思想：首先按照设计类型把全部观察值之间的变异（总变异），按设计和需要分解成两个或多个部分，每一部分变异都与特定的因素如处理因素和（或）随机因素相联系，然后以某处理因素与随机因素的均方之比构造统计量F，通过比较F值与临界值的大小做出相应的统计学推断。

以完全随机设计资料概括方差分析的基本思想。即将总变异分为组间变异（处理+随机误差）

和组内变异（随机误差）两部分。可以证明，SS总=SS组间+SS组内

世界上哪种动物的眼睛最大?

在不同的实验设计时，还可将SS总分为更多部分，同理，SS总等于多个部分SS之和。若考察处理因素的效应，可构造MS组间和MS组内之比值，由于此比值服从F分布，故称之为F值。若处理因素对受试对象无影响，则造成MS组间的变异只有随机误差，这就同MS组内一样了，故此时F值理论上应为1。但由于抽样误差的影响，一般不会正好等于1，而是近似于1。反之，若处理因素对受试对象有影响，则MS组间将明显大于MS组内，于是F值将明显大于1。

方差分析的基本条件：1.各样本是相互独立的。2.随机样本。3. 服从正态分布。4.总体方差相齐。

方差分析均数间两两比较：q检验法（SNK法）：常用于多个样本均数间两两比较。

最小有意义差别法（LSD法）：常用于对照组与各处理组的比较。

不符合方差分析假定条件的处理：1.通过某种形式的数据转换，2.采用非参数统计分析方法，如秩和检验。

1.完全随机设计资料方差分析（略）

2.随机区组设计方差分析：随机区组设计也称为配伍组设计或双因素无重复实验设计，主要用于人体或试验单位之间有明显差异或实质性差异的情况下。随机区组设计将数据按区组和处理组两个方向进行分组。通常将受试对象，按性质（如性别、年龄、病情等非处理因素）相同或相近者组成b个区组，每个区组中的k个受试对象，分别随机分配到k个处理组中去，或对同一个受试对象在同一处理，不同水平间比较。

随机区组设计可以看做是两个因素的作用，处理因素是影响实验效应的主要因素，区组（配伍）因素是影响实验效应的主要非处理因素。如区组因素为研究因素或区组因素与研究因素间有交叉作用，不能进行随机区组设计。

随机区组设计资料方差分析，将总变异分为组间变异（处理）SSA、组内变异（误差）SSe和区组变异SSB三个部分。

一般线性模型单因素

3.交叉设计方差分析

交叉设计是一种自身对照设计，最常用于新药临床试验，它可以在同一病人身上观察两种或多种处理的效应，消除病人间的差异，提高检验效能。该设计的前提是各处理方式不能相互影响，即受试对象在接受第二种处理时，不能存在前一种处理的剩余效应。另外，该设计不适用于病程较短的急性病效果研究。

交叉设计总变异SST可分为个体间变异SS1、阶段间变异SS2、处理组间变异SS3和误差变异SSe四种变异。

4.析因设计方差分析

在临床研究中，许多实验因素之间常相互联系、相互制约。而单因素完全随机设计、随机区组设计和交叉设计的方差分析，仅适用于研究主效应的实验设计，不适用于几种因素存在交互作用的情况，此时可采用析因设计进行方差分析。析因设计是将两个或两个以上因素及其各种水平进行排列组合、交叉分组的实验设计，是一种多因素、多水平交叉分组的设计方法，是有重复的两因素方差分析。析因设计可研究两个或两个以上因素及其各种水平的效应，也可以研究各因素是否存在交互作用，得到最佳组合。

析因设计进行方差分析时，应首先考察几种因素间是否存在交互作用，如有交互作用，主效应不能反映该因素的真实作用，应计算一个因素在另一个因素的某个特定水平的效应。

析因设计的变异SST包括组间变异（各处理因素的作用SSA和SSB+处理因素间交互作用SSAB）和误差变异SSe两种。

5.重复测量设计方差分析

重复测量设计是指对同一观察对象的同一指标，在不同时间点上进行多次测量，常用于分析该观察指标在不同时间上的变化规律。重复测量资料中的处理因素在受试对象间为随机分配，但受试对象内的各时间点往往是固定的，不能随机分配。

重复测量设计方差分析条件：除满足一般方差分析的条件外，还应满足：①反应变量间存在相关关系；②反应变量的方差协方差阵相等。

重复测量设计方差分析变异包括研究对象内的变异（测定时点效应）、研究对象的变异（处理因素效应）、上述两者的交互作用和随机误差变异。

分类资料统计描述及χ2检验

分类资料统计描述一般采用率、构成比、相对比、动态数列等指标进行描述，这些指标称为相对数。

率反映分类资料频率或强度指标。构成比反映分类资料分布特征或分布结构的指标。相对比是两个有相互关联的指标之比。（1）相对危险度：是指同一事件在两种不同情况下的发生率之比。通常用P1表示暴露在危险因素下某一事件的发生率，P2表示未暴露在危险因素下该事件的发生率。如患病、死亡、感染、复发等事件。RR=P1/P2。（2）优势比即比值比不锈钢t型条OR：是某事件在病例组发生的可能性与不发生可能性之比（P1/(1-P1)），与在对照组发生可能性与不发生可能性之比（P2/(1-P2)）的比值。常用于病例对照研究。OR与RR是两种表示某事件发生于暴露因素之间联系强度的指标，两者含义相同，均指暴露组的疾病危险性为非暴露组的疾病危险性的多少倍。当某个事件发生率很小时，则1-P1和1-P2约等于1，故OR约等于RR。动态数列的概念：是指一组按照时间（时期或时点）顺序排列起来的统计指标，用以观察和比较事物在时间上的变化和趋势。

χ2检验

基本思想：是检验实际频数和理论频数的差别，是否由抽样误差所引起。从χ

2检验的基本公式可以看出，χ2值反映了样本实际频数分布与理论频数分布的符合度。如果假设成立，χ2值不会太大。反之，若A与T差距大，χ2值也大，当χ2值超出一定范围时，就有理由认为原假设不成立。

χ2检验的用途及适用特征：

（1）用途：χ2检验用于独立性检验（分类变量间不相关联），推断两个及两个以上率与构成比是否有差别；两个分类变量间有无关系以及相关程度；拟合优度检验。

（2）适用特征：样本资料为非连续型变量（离散型资料或分散型变量）；总体分布未知；属于非参数分布性检验。

1. 四格表资料χ2检验：当n>40，且T≥5时，选用χ2检验基本公式或四格表资料专用公式；当n≥40，1≤T<5时，选用连续校正公式；当n<40，或T<1时，不能用χ2值，选用确切概率法求P值。

2. 配对资料χ2检验：

当b + c≥40时，用配对资料χ2检验公式计算χ2值。

当b + c<40时，用连续校正χ2值。交叉表统计量中选McNemanr。

3. 行列表资料χ2检验：

行x列表资料χ2检验主要用于两个以上率或构成比的比较，以及列联表资料（按照属性分类的频数表资料）的关联性分析。

资料要求是：T<5的个数不宜超过所有理论个数的1/5，或不宜有T<1的格子出现。如遇上述情况，可用以下方法解决：增加观察列数；合理合并相邻的行列的实际数；用精确概率法计算，直接求概率。

操作：交叉表统计量激活χ2值点击精确选Monta Carlo。

行列表资料结果显示三种疗效有差别，若进行两两比较，需进行行行现代家用纺织品设计x列表分割。行x列表分割时，检验水准为α=2α/K(K-1)=2x0.05/3x(3-1)=0.0167首先在“药物中”设置缺失值，再进行χ2检验。

4. 分层资料χ2检验

林产化学与工业例：某医师研究高血压与高盐饮食的关系，如何消除家族史混杂因素的影响，分析高血压与高盐饮食有无关系。

操作：交叉表统计量选Cochran，s and Mantel-Haenszel 选风险复选框

5. 一致性检验

诊断试验或删选试验常用的评价指标是一致性相关系数和Kappa指数。一致性相关系数用于定量资料可靠性评价，Kappa指数用于分类资料可靠性评价。结果的一致性越高，表明诊断试验或删选试验所用检测方法的稳定性越好，可靠性越高。

一致性相关系数的取值范围为-1～1.一般认为rC>0.85试验的一致性好，0.5～商君书锥指0.85试验的一致性较好，<0.5实验的一致性不好。

Kappa指数的取值范围为-1～1。一般认为K值>0.75实验的一致性好，0.4～0.75实验的一致性较好，<0.4试验的一致性不好。

秩和检验

概述

1. 参数统计和非参数统计：参数统计，即总体分布类型已知，用样本指标对总体参数进行推断或进行假设检验的统计分析方法；非参数统计不考虑总体分布类型是否已知，不比较总体参数，是进行总体分布位置是否相同的统计方法。

本文发布于:2024-09-22 01:55:27，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/268005.html

上一篇：u检验、t检验、F检验、X2检验

下一篇：体育统计学—单因素方差分析---(共六道练习题

标签：因素资料均数

留言与评论（共有 0 条评论）