样本量计算.docx - 冰点文库

资源描述

样本量计算.docx

《样本量计算.docx》由会员分享，可在线阅读，更多相关《样本量计算.docx（9页珍藏版）》请在冰点文库上搜索。

样本量计算.docx

样本量计算

文档编制序号：

[KK8UY-LL9IO69-TTO6M3-MTOL89-FTT688]

样本量计算

1.估计样本量的决定因素

资料性质

计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。

研究事件的发生率

研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。

研究因素的有效率

有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显着性，反之就要越大。

显着性水平

即假设检验第一类（α）错误出现的概率。

为假阳性错误出现的概率。

α越小，所需的样本量越大，反之就要越小。

α水平由研究者具情决定，通常α取或。

检验效能

检验效能又称把握度，为1－β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。

即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。

检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。

β水平由研究者具情决定，通常取β为，或。

即1－β=，或，也就是说把握度为80%，90%或95%。

容许的误差（δ）

如果调查均数时，则先确定样本的均数（）和总体均数（m）之间最大的误差为多少。

容许误差越小，需要样本量越大。

一般取总体均数（1－α）可信限的一半。

总体标准差（s）

一般因未知而用样本标准差s代替。

双侧检验与单侧检验

采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。

当进行双侧检验或单侧检验时，其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算

由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。

护理中的量性研究可以分为3种类型：

①描述性研究：

如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：

其目的是分析比较发病的相关因素或影响因素；③实验性研究：

即队列研究或干预实验。

研究的类型不同，则样本量也有所不同。

描述性研究

护理研究中的描述性研究多为横断面研究，横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。

分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。

例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查，采用分层多级抽样，选用的是均数抽样的公式

，Uα为检验水准α对应的υ值，σ为总体标准差，δ为容许误差，根据预实验得出标准差σ=，取α=，δ=，样本量算得520例，考虑到10%-15%的失访率和抽样误差，样本扩展到690例。

分析性研究

探索有关变量的影响因素研究

有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至少是变量数的5-10倍。

例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么研究的变量就可以在60-120例。

这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式计算，计量资料的样本量估算可用公式

，根据预实验中的数据（也可以依据其他文献的结果）得出标准差S和容许误差δ，代入公式最终计算出样本量，计数资料资料可用公式

，P为样本率。

研究某变量对另一变量的影响

对于研究某变量对另一变量的影响来说，样本量可以根据直线相关的公式

获得，μα与μβ与分别为检验水准α和第Ⅱ类错误的概率β相对应的U值，ρ为总体相关系数。

例.要做一项血透患者自我管理水平对其健康状况影响的研究，

假设α=，power=，

查表得μα=，μβ=，总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为，代入公式就可算出所需样本量为103例。

两变量或多变量的相关研究

对于两变量或多变量相关的研究，样本量与自变量的多少有关，一般是其10倍，也可以采用公式

计算。

Uα为检验水准α相对应的U值，S为标准差，δ为容许误差。

例.研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.

设定显着性水平α=，则Uα=，标准差和容许误差可从预实验中获得，根据预实验的S和δ值，算出S/δ=5，样本量则为99例.

实验性研究

实验性研究样本量的估算公式，也分计量资料和计数资料两种。

计量资料可采用两样本均数的计算公式N1=N2=

，计数资料可采用率的计算公式

。

式中N1、N2分别为两样本含量，一般要求相等，S为两总体标准差的估计值，一般假设其相等或取合并方差的平方根，δ为两均数之差值（若为自身对照，δ也可以写为d），tα／2和tβ／2分别为检验水准α和第Ⅱ类错误概率β相对应的t值。

α有单双侧之分，而β只取单侧。

例.一项心肌梗死患者院外自助式心脏康复的效果研究，可以采用此公式计算，其中的d可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷GHQ的得分：

d=，计算Sc为，双侧α=，β=，查表得tα／2=，tβ=，代入公式得出两组各需样本为56例。

附临床研究样本量的估计：

1.计量资料

对总体平均数m做估计调查的样本估计

公式：

式中：

n为所需样本大小；Ua为双侧检验中，a时U的界值，当a=时,=,a=时,=；s为总体标准差；δ为容许的误差。

例1：

某学校有学生3500人，用单纯随机抽样调查学生的白细胞水平，根据预查标准差为950个/mm，允许误差不超过100个/mm，应调查多少人

N=3500d=100个/mms=950个/mm

a=（双侧）Ua=

n=×950/100）≈347

对样本均数与总体均数的差别做显着性检验时,所需样本的估计。

单侧检验用：

n=[（U2α+U2β）s/δ]（式）

双侧检验用：

n=[（Uα+U2β）s/δ]（式）

式中：

α与β分别为第一类错误及第二类错误出现的概率，Uα、U2α、U2β分别为α、2α、2β检验水准的t值。

2计数资料

对总体率π做估计调查的样本大小

公式：

n=（Uα/δ）/P（1－P）（式）

式中：

δ为容许的误差：

即允许样本率（p）和总体率（P）的最大容许误差为多少。

P为样本率。

例2：

对某地HBsAg阳性率进行调查，希望所得的样本率（p）和总体率（P）之差不超过2%，基于小规模预调查样本率P=14%，应调查多少人（规定a=

已知：

δ=,P=，a=,Ua=

n=2/×（1－=1156

需调查约1160人.

对样本率与总体率的差别做显着性检验时,所需样本的估计。

单侧检验用：

n=（U2α+U2β/δ2）（式）

双侧检验用：

n=（Uα+U2β/δ）（式）

式中：

α与β分别为第一类错误及第二类错误出现的概率，Uα、U2α、U2β分别为α、2α、2β检验水准的t值。

对样本均数与总体均数的差别做显着性检验时,所需样本的估计。

单侧检验用：

n=[（U2α+U2β）s/δ]P（1－P）式）

双侧检验用：

n=[（Uα+U2β）s/δ]P（1－P）（）

式中：

α与β分别为第一类错误及第二类错误出现的概率，Uα、U2α、U2β分别为α、2α、2β检验水准的U值。

3病例对照研究的样本量估计

选择患有特定疾病的人群作为病例组，和未患这种疾病的人群作为对照组，调查两组人群过去暴露于某种（些）可能危险因素的比例，判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。

设置估算样本量的相关值

①人群中研究因素的暴露率（对照组在目标人群中估计的暴露率）；

②比值比（oddsratio，OR）估计出的各研究因素的相对危险度或暴露的比值比（即RR或OR）

③α值，检验的显着性水平，通常取α=或；

④期望的把握度（1-β）,通常区β=或；即把握度为90%或80%。

根据以上有关参数查表或代公式计算

公式为：

n=（U+U）/（p1-p0）2（式）

p1=p0×OR/1-p0+OR×P0

=1/2（p1+p0）=1-q1=1-p1q0=1-p0

p0与P1分别为对照组及病例组人群估计的暴露率；

OR为主要暴露因子的相对危险度或暴露的比值比（RR或OR）。

q0=1-P0,q1=1-P1;

为两组暴露史比例的平均值,

既=（P1+P2）/2,Q1=1-P1;

例：

拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。

估计孕妇有30%暴露于此因子。

现要求在暴露造成相对危险度为2时，即能在95%的显着性水平以90%的把握度查出，病例组和对照组各需多少例

p0=OR=2，设α=,β=,

用双侧检验Uα=Uβ=

p1=×2）/[1+（2-1）]=

q0===1/2+=

q1====

n=+）2/≈192，即病例组与对照组各需192人.

4实验研究的样本量计算

计量资料:

计量资料指身高、体重、血压、血脂和胆固醇等数值变量。

估计公式为：

（式）

n为计算所得一个组的样本人数，如果两组的人数相等，则全部试验所需的样本大小为2n；

Uα为显着性水平相应的标准正态差；

Uβ为β相应的标准正态差；

δ为估计的标准差，δ2=（δ12+δ22）/2；

d为两组数值变量均值之差，

例题：

某新药治疗高血压，将研究对象随机分为治疗组和对照组。

假设：

a=,β=,血压的标准差分别为与,检测两组的血压差为。

查表：

zα=,

zβ=（双侧检验）,需要多大样本。

计数资料:

即非连续变量资料，如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。

当现场试验的评价指标是非连续变量时，按下式计算样本大小：

n=[U+U]/（P-P）（式）

P：

对照组发生率

P：

实验组发生率

5诊断试验的样本量估计

设置估算样本量的相关值

①灵敏度60%；

②特异度60%；

③α值，检验的显着性水平，通常取α=或；

④期望的把握度（1-β）,通常区β=或；即把握度为90%或80%。

计算公式

公式：

n=（Uα/δ）/P（1－P）（式）

式中：

Uα为显着性水平相应的U值,通常取α=或；

δ为容许的误差：

即允许样本率（p）和总体率（P）的最大容许误差为多少。

P为诊断试验的灵敏度或特异度；

例：

预计所评价的诊断试验的灵敏度为90%,特异度85%；

δ=，规定a=,病例组和对照组应调查多少人

已知：

δ=,a=,Ua=

n=2/×（1－=783

n=2/×（1－=553

对照组需783人,病例组需553人。

参考文献

[1]胡修周.医学科学研究学[M].北京:

高等教育出版社.2006,76.

[2]刘娜，倪平，陈京立.护理研究中量性研究的样本量估计[J].中华护理杂志，2010，45（4）:

378-379.

展开阅读全文