医学研究中常见的样本量估算方法

医学研究中常见的样本量估算方法
样本量计算是科研设计中非常重要的一个环节,通过随机抽样技术来选择研究对象,确定多少样本量至关重要。样本量过少,可能会导致假设的问题无法回答,以至于整个研究功亏一篑;样本量过多,势必带来人力、物力、财力的额外消耗,产生不必要的困难和浪费。本文主要介绍与样本量估算有关的因素及样本量计算过程。
1样本量估算需要考虑的因素
样本量是根据事先确定的因素来估算的,影响样本量大小的因素有很多,常见的有以下几种。
1.1假设检验的方向      
研究假设是针对特定总体提出的、与主要研究目的有关的一种假定。例如比较两种药物高血压的疗效,通常会事先假定两组药物的疗效无差异(通常称为无效假设),然后在此假定下,收集数据计算统计量和P值,判断当前数据结果是否支持这一无效假定,如果有足够的证据可以推翻无效假设,就可以接受无效假设的对立面——备择假设,也就是认为两组药
物疗效有差异。
在研究假设中,不同的假设方向会影响样本量大小,一般可分为单侧假设和双侧假设。如比较A、B两种药物疗效,如果研究者不确定二者谁优谁劣,验证的是A¹B,这就是双侧假设。如果研究者很明确A的疗效一定高于B,或B的疗效一定高于A,验证的是A>B或B>A,这就是单侧检验。单侧检验和双侧检验所需要的样本量不同,一般单侧检验所需样本量低于双侧检验。
如果研究者有100%的把握认为关联只有一个方向,那可以考虑单侧检验,但有时即使研究者认为不可能出现双侧关联,结果往往仍会出乎其意料。所以比较稳妥的方法是采用双侧检验。但是一定要注意,使用单侧或双侧检验是事先确定的,而不是数据收集分析后才临时改变。
1.2一类错误和二类错误  木酢液   
任何研究,当根据数据做出结论的时候,总会面临一定的抉择错误。例如,研究服用塞来昔布是否导致心血管事件风险的增加,可以接受无效假设,认为二者无关联;也可以接受
备择假设,认为二者有关联。不管做出何种结论,都有可能犯错误。如果实际上二者并无关联,而你做出了接受备择假设的结论,那就犯了假阳性错误(即本来是阴性结果而做出了阳性结论),这种错误也称为一类错误或I型错误(通常用α表示);如果实际上二者是有关联的,而做出了接受无效假设的结论,那就犯了假阴性错误(即本来是阳性结果而做出了阴性结论),这种错误也称为二类错误或II型错误(通常用β表示)。
与二类错误有关的一个重要概念是把握度(power),把握度是指如果备择假设为真的条件下,统计学结论正确拒绝无效假设的概率。例如,如果塞来昔布确实增加心血管风险,统计学结果正确拒绝了无效假设(塞来昔布不增加心血管风险)的概率。把握度跟二类错误(β)正好是相对立的,所以通常表示为1-β。
在计算样本量的时候,必须考虑一类错误和二类错误(或把握度)的大小。不管是一类错误还是二类错误,设的越小,所需的样本量越大。很多情况下,研究者习惯将一类错误(α)设为0.05,二类错误(β)设为0.2(即把握度1-β设为0.8),但这并非一成不变,可以根据研究目的来调整。例如塞来昔布是否增加心血管风险的研究中,研究者考虑到该药研发期间的耗费,认为犯一类错误是很严重的,可能会使前期投入完全浪费,那么可以
将α设的低一些(如0.025)。反过来,如果研究者认为心血管事件风险的增加是很严重的,因为这不仅是个人健康问题,还是公共健康问题,此时可以将β设的小一些(如0.05)。
1.3效应值大小    
效应值就是总体中的关联强度,关联强度在不同研究中有不同的体现形式,如组间比较体现为组间差值,相关性分析体现为相关系数,logistic回归中体现为OR值,等。
一般来说,总体中效应值越大(如两种方式的空腹血糖相差20 mg/dl,或幽门螺杆菌阳性对胃癌的OR值为2.5),所需样本量越小;效应值越小(如两种方式的空腹血糖相差2 mg/dl,或幽门螺杆菌阳性对胃癌的OR值为1.2),所需样本量越大。
如何选择一个恰当的效应值是比较困难的,很多情况下,研究者并不清楚总体中的效应值到底是多少。但在计算样本量的时候,我们不得不事先假定一个效应值。如果研究者对所研究的效应值不清楚,可以查阅文献或咨询专家,必要时可以通过预实验来获得。
上海绿地集团陈军1.4其它因素     
除上述几个主要因素外,还有很多其它因素也会影响到样本量大小,如组间比较时,变异(通常用方差或标准差表示)越大,所需样本越大;组间例数不等所需样本量要大于组间例数相等的情形;研究的混杂因素越多,所需样本量越大。
抽样调查中还需要考虑设计效率问题。设计效率值是指对于同一目标量,调查单位相同时,所考虑的抽样设计估计量方差与完全随机抽样设计(不放回)估计量方差的比值。设计效率值越大,所考虑的抽样设计的误差越大,表明该设计的效率越低。此时要想达到跟完全随机抽样相同的效率,就需要更多的样本量。抽样调查中,整抽样的设计效率值较大,不少专家建议整抽样设计效率值可至少应设为2,即对于整抽样,至少需要2倍的样本量,才能达到与完全随机抽样相同的效率。
2常见研究的样本量估算
2.1横断面调查的样本量估算      
横断面调查大多是为了调查某疾病的患病率,其样本量的计算需要考虑该疾病的预期发病率,并指定调查的精确度d(研究者容许的偏离总体值的程度)。通常精确度可设定为预期
发病率的百分比(如预期发病率为20%,精确度为预期发病率的10%即2%)。此时样本量计算公式为:
造型艺术的特点式中,Z1-α/2为标准正态分布下面积为1-α/2所对应的百分位数。p表示预期发病率。ε为预期发病率的百分比。
例1:某研究欲调查当地学龄儿童的龋齿患病率,为了调查方便,采用整抽样的方法。研究者根据以往资料发现当地学龄儿童的龋齿患病率约为30%,现欲以95%的可信度,要求结果落在总体真实率的10%以内。共需调查多少儿童?
该研究中,p=0.03,ε=0.1,α=0.05,则Z1-α/2=1.96。计算结果如下:
对于整抽样,通常需要考虑设计效率的问题,即通过上式计算出897例之后,还需要乘以设计效率值才能达到与完全随机设计一样的效率。假定本研究设计效率值为2,则采用整抽样需要897×2=1794例。
2.2两组均值比较的样本量估算     
两组均值比较通常需要事先获得两组均值和标准差,然后根据一类错误和把握度按下式计算样本量:
式中,和表示标准正态分布中对应1-α/2和1-β的百分位数。nc表示对照组例数,表示实验组均值,表示对照组均值,k表示实验组与对照组例数的比例,s表示两组合并标准差。可通过下式计算, s1、s2是两组的标准差,n1、n2是两组的例数。
例2:某研究欲比较两种药物糖尿病的效果,研究者采用随机对照试验,拟将糖尿病患者分为样本相等的两组,分别采用两种药物进行,以服药后空腹血糖值作为主要疗效指标。研究者通过以往文献获得两种药物的空腹血糖均值和标准差分别(8.06±1.82)和(7.23±1.52)mmol/L,据此计算出合并标准差为1.68。同时研究者设定α=0.05,并希望能有80%的把握发现两种药物的真实差异,该研究应如何确定样本含量。将相应的指标值代入公式,计算可得
即对照组需要65例,根据1:1分配,两组共需130例。
2.3两组率比较的样本量估算      
两组率比较需要事先获得两组的预期率,然后根据一类错误和把握度按下式计算样本量:
式中,和表示标准正态分布中对应1-α/2和1-β的百分位数。nc表示对照组例数,表示实验组比例,表示对照组比例。k表示实验组与对照组例数的比例。
例3:续例2,假定研究者以空腹血糖疗效作为主要疗效指标,通过以往研究获得两组有效率分别为83%和71%。试进行样本含量估计。将两组率代入公式,计算可得
即对照组需要190例,根据1:1分配,两组共需380例。
2.4两组生存资料比较的样本量估算      两组生存资料的比较需要事先获得两组的预期死亡风险、招募时间等,然后根据一类错误和把握度按下式计算样本量。
氢氧化钾溶液式中,λt和λc分别表示实验组和对照组的风险率,和分别表示实验组和对照组风险率的方差,其计算公式为:
一件运动衫其中,表示实验组或对照组的风险率,T0表示招募时间,T表示总的研究时间,T- T0表示随访时间。当服从指数分布时,风险率和中位生存时间可进行换算,风险率=ln2/中位生存时间。透明的距离
例4:某研究采用完全随机设计,比较两种药物对肺癌患者生存时间延长的效果,研究的主要疗效指标是生存时间(月)。根据以往文献发现,两组的中位生存时间分别约为13和8个月。该研究预计招募受试者的时间为6个月,并随访30个月,并且研究者希望能有80%的把握发现两种药物的真实差异,该研究应如何确定样本含量。

本文发布于:2024-09-22 07:11:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/585519.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:样本量   研究   表示   研究者   设计   错误   风险
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议