统计学知识点(完整)

统计学知识点(完整)
基本统计方法
第一章 概论
1、 总体(Population):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。
2、 参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,就是固定的常数;统计量(Statistic):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,就是在参数附近波动的随机变量。
3、 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章 计量资料统计描述
1、 集中趋势:均数(算术、几何)、中位数、众数
2、 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV )
3、 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ与形态参数σ;④曲线下面积为1,区间μ±σ的面积为68、27%,区间μ±1、96σ的面积为95、00%,区间μ±2、58σ的面积为99、00%。
新密市人事劳动局
4、 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法:P 2、5-P 97、5。
第三章 总体均数估计与假设检验
1、 抽样误差(Sampling Error):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因就是生物个体的变异性。
2、 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公
式:/X σσ=,说明抽样误差的大小。
3、 降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S 。
阎健宏4、 t 分布特征:
①单峰分布,以0为中心,左右对称;
②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高;
③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布就是t 分布的特例。
5、 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。
6、 假设检验的基本原理:小概率反证法的思想。
①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)就是否成立。
②小概率事件:在H 0成立的条件下计算检验统计量,根据概率分布确定检验水准α下P 值
大小,判断就是否为小概率事件(通常P≤α视为小概率事件,α通常取0.05),就是则拒绝H0,接受H1;否则尚不能拒绝H0。
7、假设检验一般步骤:①建立假设(反证法,H0与H1),确定检验水准(α);②计算统计量:u,t,F;
③确定概率值P,做出推断结论。
8、t检验需满足的条件:比较的两个样本相互独立、均服从正态分布。
9、P的含义:就是指从H0规定的总体随机抽样,抽得等于及大于(或/与等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。
10、Ⅰ型错误(Type Ⅰerror):拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,Ⅰ型错误的大小为检验水准α。Ⅱ型错误(Type Ⅱerror):接受了实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误,Ⅱ型错误的大小用β表示,1-β表示检验效能。α越小,β越大,增大样本量可以同时降低α与β。
11、置信区间与假设检验的区别与联系:①可以通过判断置信区间就是否包含零假设,判断单样本均数就是否来自已知的总体;②置信区间不但能回答差别有无统计学意义,还可提示差别有无实际意义。③假设检验可提供置信区间不能提供的信息,如P值与检验效能等。
第四章方差分析
1、方差分析的基本思想:根据研究目的与设计类型,把所有测量值的总变异按照处理因素与水平等分解成两部分(组内变异与组间变异)或更多部分,同时把对自由度相应进行分解,再进行比较,评价由处理因素引起的变异就是否具有统计学意义。
2、方差分析的应用条件:各样本就是相互独立的随机样本,均来自正态分布的总体,各样本的总体方差相等(具有方差齐性)。
3、方差分析表:
变异来源SS νMS F P
组间变异 a g-1 a/(g-1) MS组间/MS组内
组内变异 b N-g b/(N-g)
总变异a+b N-1
4、g=2时,随机区组设计的方差分析与配对设计资料t检验等价,t=。
5、多个样本均数间的多重比较:①LSD-t检验,即最小显著差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较;②Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较;③SNK-q检验:适用于多个样本均数两两之间的全面比较。
第五章计数资料的统计描述
网络对话
1、相对数的类型:强度相对数(率,如死亡率、发病率等);结构相对数(构成比);相对比(如性别比等)fmcm
2、应用相对数的注意事项:①结构相对数不能代替强度相对数;②计算相对数应有足够的数量;③正确计算合计率;④注意资料的可比性;⑤对比不同时期资料应注意客观条件就是否相同;⑥样本率(或构成比)的抽样误差。
3、标准化率(Standardization rate):采用标准化法进行计算,消除数据内部构成的差异,使标化后的合计率具有可比性,这种经过标化后的合计率称为标准化率。
4、标准化率的注意事项:①只适用于内部构成不同,影响总率的可比性的问题;②选择的标准不同,计算得到的标准化率也不同,多个标准化率比较时,应选同一标准;③标准化率已经不再
反映当地的实际水平;④样本标准化率就是样本值,存在抽样误差。比较两样本标准化率,当样本量较小时,需做假设检验。
第六章 几种离散型变量的分布及应用
1、 二项分布X ~B (n , π)的适用条件:①每次试验只发生两种对立的可能结果之一;②每次试验产生某结果的概率π固定不变;③重复试验就是相互独立的。化验室组织与管理
2、 二项分布的性质:①阳性次数X 的总体均数(n μπ=)、标准差(σ②样本
率p 的均数(p μπ=)、标准差(p S =,即率的标准误)。③二项分布的正态近似条件:np 与n (1-p )均大于5。
3、 泊松分布X ~P (λ)的性质:①总体均数λ与总体方差σ2相等;②当n 很大,π很小,且np = λ
为常数时,二项分布近似泊松分布;③λ≥20时,泊松分布近似正态分布;④泊松分布具备可加性。
第七章 χ2检验
1、 χ2检验的基本思想:根据χ2分布特征,通过比较实际频数与理论频数的差异,确定在H 0成立的条件下该差异由抽样误差造成就是否为小概率事件,进而判断差异就是否具有统计学意义。χ2值反映了实际频数与理论频数的吻合程度。
2、 R×C 列联表中的各格子T≥1,并且1≤T <5的格子数不宜超过1/5格子总数,否则可能产生偏差。处理方法有三种:①增加样本量,使理论频数增大;②根据专业知识,删除或合并行列;③采用Fisher 确切概率法分析。
3、 有序分组资料表线性趋势检验:
①双向无序的R ×C 列联表:多个样本率的比较采用R×C 列联表的χ2检验;两个分类变量的关联性分析则采用R×C 列联表的χ2检验与Pearson 列联系数进行分析。
参考文献②单向有序的R ×C 列联表:行有序而列无序:R×C 列联表的χ2检验;行无序而列有序,采用Wilcoxon 秩与检验。
③双向有序属性相同的R ×C 列联表:配对四格表的扩展,采用一致性检验(Kappa 检验)。 ④双向有序属性不同的R ×C 列联表:样本率的比较采用Wilcoxon 秩与检验;相关性分析采用Spearman 相关分析;线性变化趋势分析采用有序分组资料的线性趋势检验或CMH χ2检验等。
第八章 非参数检验
1、 秩与检验的适用范围:①总体分布偏态的计量资料;②数据两端有不确定值;③等级资料;④各组离散程度相差悬殊,总体方差不齐的资料。
2、 非参数检验对总体分布的形状差别不敏感,只对总体分布位置差别敏感;非参数检验没有充分利用资料信息,较参数检验的检验效低。故能用参数检验尽量采用参数检验,不满足参数检验条件才使用非参数检验。

本文发布于:2024-09-22 07:17:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/93971.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:总体   样本   检验
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议