非劣效性等效性临床试验文档格式.docx
《非劣效性等效性临床试验文档格式.docx》由会员分享,可在线阅读,更多相关《非劣效性等效性临床试验文档格式.docx(13页珍藏版)》请在冰点文库上搜索。
当然,界值也不能过小。
例12--1为了显示一种新药血管紧张素H拮抗剂(AII)治疗轻中度原发性高血压的降压效果不差于标准药血管紧张素转换酶抑制
剂(ACE),主要终点指标用仰卧舒张压()的下降幅度,{变化量}应如何考虑制定非劣性界值的问题?
资料表明,,既往ACE与安慰剂的对照试验显示最小的药物效应
差值△为1.34kPa(10mmHg),基于临床考虑,认为用S0=O.4OkPa约为△的1/3)作为非劣效性试验的界值是合理的{有文献表明不可取},即只要AI的平均降压不比ACE的平均降压值小0.40kPa或更多,则可认为AI与ACE相比为非劣效。
当然,若适当放宽控制非劣效的标准时,So的取值可稍微大些,例如So=O.67Okpa(约为△的1/2)。
2.I、I型错误概率I型错误概率用a表示,指事实为劣效/不等效时拒绝了劣效/不等效的概率;
I型错误概率用表示,指当事实为非劣效/等效是接受了劣效/不等效的概率。
检验功效power=1—B。
一般准则是,a取0.05或0.10,B取0.05、0.10或0.20。
新药注册研究中,a取0.05或0.10,B取0.20或0.10可被认可。
3.变异度反映两组总的变异程度,一般用方差(或标准差)表
示。
两组定量指标均数比较,其方差可通过两组样本方差估计,或用标准治疗组方差,或以既往研究结果作为估计值。
两组率指标比较其方差可通过两组样本率估计,或根据既往知识取值;
若难以获知事先信息。
可用50%作为总体率,估算最大样本含量。
4.终点指标类型及效应测量最常见的终点指标和二分类指
标。
从非劣效性/等效性对比判定考虑,还需考虑效应指标差值或比值的选择问题,一般使用差值。
对两组比较以3表示两组总体参数或比值。
在实际进行非劣效性/等效性设计时往往不能获知3的大小,通常令3=0(两组为差值时)或3=1(两组为比值时)。
5•比较类型设计非劣性试验是为了显示试验治疗按照一个事先制定的界值3o不差于标准治疗,该类型试验关心的问题是单侧的,但对试验治疗可能优于的程度未加限制。
而等效性试验关心的问题则是双侧的,希望阐明两种治疗的效应在两个方向上差别不大,即分别
按照界值3oi和302揭示出试验治疗既不比标准治疗差,也不优于标准治疗。
从假设检验的角度考虑,双侧等效性不同于大家熟知的通常意义上的双侧检验情形(图12-2a)。
后者涉及的无效假设是3取单个数值3°
备选假设取两个方向上的不同于3o的任何值,因此其备选假设是“双侧”的。
然而,在双侧等效性情况下(图12-2b),无效假设(3<
3oi或3>
302)是双侧的。
这种比较类型的不同将体现在样本含量估计中。
6.两组的例数分配比例两组比较去相等的样本含量时总样本含量最少,且可在同等总样本含量下达到最高的统计效能,当然,实际工作中也可按需要进行两组不等的样本含量估算。
试验中有时尚需结
合具体情况进行适当调整,例如考虑最多的是依从性和失访问题。
(1)依从性(complianee)临床试验的困难之一就是患者不遵从指定的治疗。
从保守的角度考虑,假定不依从的患者没有从治疗中收益,则样本含量调整计算式为:
nadj
(1Pm)2
式中,Pm:
不依从的比例,表12-2列举了不同的不依从比例的调整因子大小。
表12-2不同的依从比例下的调整因子大小
不依从比例
0.05
0.10
0.20
0.30
0.50
调整因子=1/(1—
Pm)21.11
1.23
1.56
2.04
4.00
(2)失访(losstofollow-up)泛指分析时未能获得终点结果。
假定失访率为I,则样本含量调整公式为:
n
n二
1-I
它假定所有患者的失访都发生在随机化时(?
?
),可见该结果偏于
保守。
(二)非劣效性/等效性试验样本含量的估计方法
非劣效性试验两组总样本含量计算通用公式为
式中,N:
两组总样本含量;
匚2:
方差;
・,「:
:
对应于a和B的标
准正态离差;
k和(k—1):
各组在总样本中所占的比例;
5:
对照组减试验组的总体真实差值;
5°
:
临床上可以接受的界值。
对非劣效性/等效性试验,常设定5=0
方差二2须事先给定。
对于率指标,若两组总体率相同且已知为n,则匚2二n(1—n);
若两组总体率不同,则n可取两总体率的平均数。
实际应用中常难以获得总体信息,可以预实验结果代替。
设T代表试验组,P代表阳性对照组,根据预实验结果对方差进行估计,定量指标和二分类率指标的计算公式分别为
&
sT(n.-1)S2(np-1)
S二
片+2
S2=Pc(1-Pc)
式中,Pc:
为两组预实验样本的合并率,Pc二"
PT"
PP。
E+np
对等效性试验,假定两端界值等距,即502=-5oi=5o,计算总体样本含量将单侧「替换为双侧「/2即可。
例12-2例12-3
由上例计算结果不难理解,若试验目的主要在于确认新药不比标准药差。
而不关心新药是否比标准药好,采用非劣效性试验更节省样本含量。
二、非劣效性/等效性试验中的统计推断
(一)判定非劣效性/等效性的假设检验方法
我们平时所做的觉得多数假设检验其零假设为两总体参数相等,其统计推断往往仅限于两者的差别是否有统计学意义。
若P>
a,意味着统计上“不能拒绝零假设”,但并非说明零假设成立,更没有理由说两组相等;
若P<
a,虽然可“拒绝零假设”,但也只能推断两者在统计上有差别,而不能评价差别的大小。
为能对非劣效性/等效性进行推断,需要建立有别于传统的检验假设,并据此进行统计推断。
1.检验假设的构建无效假设和备选假设分别用Ho和Ha表示。
以a作为总的检验水准。
设T为试验组参数,P为阳性对照组参数,表12-3列举几种不同情形的检验假设。
(此时不能在称无效假设为零假设了)
表12-3不同试验类型的检验假设
试验类型
无效假设
备选假设
检验水准
非劣效性试验
Ho:
T—P<
-So
Ha:
T—P>
a
等效性试验
Hoi:
T—PW-So
Hal:
T—P>
a/2
H02:
T—P>
So
Ha2:
T—PvSo
统计优效性试验
Ho:
T—PWo
Ha:
o
临床优效性试验
T—PWSo
假设检验的意义:
1非劣效试验H。
试验药劣于对照药,其差值大于或等于-So
试验药非劣于对照药
2等效性试验H°
i:
试验药劣于对照药,其差值大于或等于-S
Hal:
H02:
试验药优于对照药,其差值大于或等于S0
Ha2:
试验药非优于对照药
3优效性试验Ho:
两药疗效相等或试验药劣于对照药,其差值大于
或等于0或者So
试验药优于对照药
2.检验统计量和推断结论
(1)非劣效性试验由非劣效性试验的检验假设可见只需进行
一次单侧检验即可做出推断结论。
若P<
a,则拒绝Ho,可推论T非
劣效于P;
若P>
a,则还不能下非劣效的结论。
这里的a含义是,当T比P疗效差,其效应值实际上超过So时,错误地下T非劣效于P的结论的概率。
1)定量指标均数的非劣效性检验用单侧t检验,统计量计算
式中,SXT-xP:
两组均数差值的标准误
0侶P)
Et-FP
11
SPT-Pp\|Pc(1Pc)()
VnTnp
(2)等效性试验对等效性的推断需要采用双向单侧检验,即
在两个方向上同时进行两次单侧检验(twoone-sidedtests)若P1<
a/2和P2Wa/2同时成立(注意每次检验的水准用总的检验水准a
的一半),{要求总的检验水准为a,即要求检验假设允许的I型错误概率总的为a,这
样解释对不对?
VS•析因分析和重复测量资料的方差分析}_则两个无效假设均被拒绝,前者推论T不比P差,后者推论T不比P好,因此综合的推断是T和P具有等效性;
若P和P2中任何一个大于a/2,则不可下等效的结论。
这里a含义是,当T与P的疗效差值实际超过50(包括比50还小{比-50还小}的比50还大两种情况)时,错误的下T和P等效结论的概率。
1)定量指标:
均数的等效性检验需进行两次单侧t检验,一次
式分别为:
2)率指标:
率的等效性检验用两次单侧u检验,统计量计算公
Ui
(R—ppveo)
Spt_Pp
o-(PT-Pp)
SPT-Pp
(3)优效性试验优效性试验有两种不同的情形:
①一种是从
统计学角度考虑的优效性,其假设为零假设,用单侧检验。
如果能拒
绝无效假设,可下统计学意义上优效的结论。
当然这种优效性较弱,有事可看作是边缘优效性。
其统计量计算公式为:
Xt-Xp-0
SxT-X;
2另一种是从临床意义上提出的优出一定量的优效性。
此时若拒绝无效假设,可下临床优效性的结论,一般认为疗效的确认应基于临床意义。
(Xt—Xp)-0
(二)判定非劣效性/等效性的可信区间方法
可信区间方法亦可用于非劣效性/等效性的判定,该方法通过构
建有关参数差别的可信区间(confideneeintervalCl)作为评价的决策准则。
假定总的可信度取100(1-a)%,以Cl表示可信区间的下限,以Cu表示可信区间的上限
1.非劣效性试验按单侧100(1-a)%的可信度,计算出T—P
的可信区间的下限Cl,若[Cl,乂]完全在[50,乂]的范围内,或者Cl
>
3°
可下非劣效性的结论。
0cl
(1)定量指标计算两组均数差值可信区间下限的公式为:
C「(XtXp)-tsxtxp
式中,t.:
自由度为V,检验水准为a时的单侧t分布界值
(2)计算两组率差值可信区间下限的公式为:
C|_=(片-Pp)-uSPTPp
式中,u.:
检验水准为a时的单侧正态分布离差界值。
2.等效性试验按双侧单侧100(1-a)%的可信度,计算出T—P的可信区间的下限Cl和上限Cu,若[Cl,Cu]完全在[—50,5o]范围内,或者-"
Cl:
Cu:
,o,可下等效性结论。
(1)定量指标计算两组均属差值可信区间下限和上限的公式分别为:
Cl=(Xt「Xp)「t:
/2,sxt_xp
CU=(Xt一Xp)t:
/2「S石_齐
式中,t:
./2:
自由度为V,检验水准为a时的双侧t分布界值
(2)率指标计算两组率差值可信区间下限和上限的公式分别
为:
CL=(R■一Pp)—U/2SFV-Pr
式中,U-i2:
检验水准为a时的双侧正态分布离差界值。
3.优效性试验按按单侧100(1-a)%的可信度,计算出T—P的可信区间的下限CL,若[Cl,乂]不包括0,或CL>
0,可下统计学优效性结论;
若[Cl,x]完全超出(一X,80)范围,或者Cl>
50,可下临床优效性结论。
d6也I
0§
0Cu
三、有关非劣效性/等效性临床试验的进一步说明
1.等效与非劣效的概念界定有关“临床等效性”的概念在非劣效性和等效性之间仍有混淆,似乎只要试验药不比阳性药差都笼统的称为等效。
但严格地讲,等效性和非劣效性是有区别的,正如生物利用度的等效性一样,新药比参照药不能低太多,也不能高太多,低了达不到参照药的效果,高了可能有更多的毒性。
临床疗效上要求“等效”似无必要,因为实际上只要关心试验药不比标准对照药差就行,至于在另一个方向上的好与不好则无所谓(如果确实关心试验药是否更好,可按优效性实验设计)。
因此,用阳性对照的临床试验最好统一归属为非劣效性试验。
当然,若按等效性实验设计也未尝不可。
2.统计学推断的选择等效性或非劣效性的统计学推断更倾
向于使用可信区间法。
等效性推断采用双侧可信区间,当可信区间完全落在等效性界值内,则推断为非劣效。
若使用假设检验方法时,等效性试验采用双向单侧检验,实际上是进行两侧单侧检验,而非劣效性试验(和优效性试验)则采用单侧检验一次完成推断。
3.非劣效性、优效性的转换实际工作中如果非劣效性证据很
强,则可预先在临床研究方案和统计分析计划中作出规定,即当非劣
效性试验的无效假设被拒绝,可以推断试验药比对照药具非劣效性
时,还可进一步检验试验药是否还优效于阳性对照药。
4.疗效确认的条件这是一个必须重视的问题。
随机双盲、安
慰剂对照的临床试验一直被奉为确认药物疗效的金标准,如果试验药
能显示出比安慰剂具有临床优效性(superiority)的足够证据,则可以确认其有效性。
然而,如果研究的疾病危重,或已有当前公认有效地药物时,仍实施安慰剂对照临床试验,会面临医学伦理学和依从性的问题。
如果选择阳性药物为对照,试验设计最关键的问题是:
该试验是用于证明两种药物之间的差异,还是证明两种药物的非劣效性
(non-inferiority)或等效性(equivalenee)。
这种变化同时要求统计设计和分析方法的改进。
对非劣效性或等效性疗效的确认则需要满足其他条件。
在几种不同目的的临床对照试验中,疗效的确认应具备:
1以安慰剂为对照的试验应显示出高于临床认定疗效的界值。
从而判断其优效性;
{属于统计优效还是临床有效?
为什么和安慰剂比较?
想达到
什么效果?
}
2以阳性药为对照的试验如果显示出试验药比对照药高于临床
上认定的疗效界值,从而判断其优效性;
3以阳性药为对照的试验如果显示出试验药在一定的临床界值下不差于阳性药,同时又有证据反映试验药和阳性药均从临床意义上优于安慰剂,可确认其非劣效性;
4以阳性药为对照的试验如果显示出试验药在一定的临床界值
下不差于阳性药,且有证据反映试验药和阳性药均从临床意义上优于安慰剂,同时试验药在一定的临床界值下又不优于阳性药,可确认其
等效性。
可见,对于没有同期设立安慰剂对照的阳性对照试验,不仅无法
直接确认阳性对照药物在当前试验条件下的有效性,也无法直接确认试验药物的疗效。
实际问题研究中之所以采纳两组平行阳性对照实验设计,是因为通常隐含的假定是在现有的试验条件下,阳性对照的治疗效应时客观存在的。
{?
?
}但事实上,因为非同期研究中的患者样本可能代表不同的患者群体,阳性对照效应在目前的人群也许不存在,虽然有一定效应也可能与原来的效应不同。
也就是说,即使非劣效性试验得出试验药非劣效于阳性对照的结论,理论上仍有肯会出现试验药疗效比安慰剂还差的极端结果。
所以,阳性对照试验仍存在一些难以直接通过试验本身进行验证的问题。
当然,如果现在的阳性对照试验在设计、患者群体特征和治疗环境等方面尽可能地同以往的研究相似,且质量控制好,则可以保持阳性对照检测的灵敏性,该设计仍被认为时合理的,可以用来简接地确认试验药物的疗效。
如果没有足够的证据表明满足上述条件,则不能采用阳性对照实验设计。
一种最佳的实验设计,也许应该再同时设立一个安慰剂对照组(称为三手试验){?
}。
无疑,伦理问题、试验成本增加等因素又限制了这种试验的实施。