当前位置: 首页 > 医学版 > 期刊论文 > 大学学报(医药卫生) > 山西医科大学学报
编号:10292431
临床试验中的期中分析
http://www.100md.com 37c医学网
     作者:郭静 何大卫

    单位:郭静(山西医科大学卫生统计学教研室 太原 030001);何大卫(山西医科大学卫生统计学教研室 太原 030001)

    关键词:临床试验;期中分析;名义检验水准;统计学

    山西医科大学学报000157 中图分类号: R195.1 文献标识码: A

    文章编号: 1007-6611(2000)01-0087-03

    临床试验是评价一新的治疗方法(包括:药物、设备、过程等)的标准。1975年,美国的 Greenberg 首先提出“进行临床试验时间不应长于得出处理有效差别所需时间”,另外,临床试验不应产生不可逆转的或有害趋势[1]。将期中分析作为临床试验的步骤之一,这一观点已得到普遍接受并在应用中显示出基本重要性和特殊性。本文将就期中分析方法的产生、现状及发展作一综述。
, 百拇医药
    1 问题的提出

    传统的临床试验是将受试验对象随机分为两组,分别接受 A、B 两种处理,并事先确定受试人数和时间,试验结束后进行相应的统计学分析,以了解某种治疗措施的疗效。从临床观点来看其主要缺点是:

    不符合医学伦理道德准则。病人被随机分到处理组和对照组,在时间 ti 时有以下 3 种结果:①处理组明显优于对照组。则从 ti 到 T 时,对照组将接受较差的治疗,从而影响其痊愈,这不仅是不道德的而且增加了患者的经济负担。②两处理组无差别。③实验组病人出现严重的副反应。

    对于①、②两种情况是停止试验还是继续?传统的试验设计很难确定并给以恰当的解释。

    从统计学观点来看,其主要缺点是:在实际工作中,常见到研究者在 α=0.05 水准,分别对 t1,t2,………tI 的各阶段累积数据反复作两两比较,会加大总的 I 类错误,且随着检验次数的增加,总 α 逐渐增大[2]。为了使重复检验 I 类错误仍为 α,每次重复检验采用比较严格的名义检验水准(nominal significance level),记作α′。
, 百拇医药
    2 期中分析的含义

    期中分析就是在临床试验过程中对中间结果进行监测(monitoring),包括统计学分析和临床分析。进行期中分析的主要意义为:①监测研究者对方案的依存性(是否依据课题的设计进行研究);②监测研究者对患者的处理分配;③监测药物的适合剂量、安全性及副作用。早期的期中分析可为剂量的制定和变更提供科学依据,而且一旦试验组或对照组出现严重的副作用,应立即停止试验(endpoint)。④监测处理组间受试效应的差别,一旦试验组和对照组的疗效出现差别则可终止试验,这也是进行期中分析的最主要目的。

    3 期中分析方法的发展

    期中分析的思想源于序贯试验,但序贯试验用于临床研究的缺点是:①要求受试者较快地出现治疗结果,只能适用于类似麻醉、止痛等能在短期内见效的急性试验,难以用于最常见的几天或几周才能知道结果的中、长期临床试验。②临床试验中,受试者成批进入试验,不允许有治疗等待时间,所以不能满足序贯设计逐一试验逐一分析的要求。
, http://www.100md.com
    3.1 成组序贯期中分析方法[3,4,5]

    3.1.1 固定名义检验水准法 1997年 Pocodk 教授提出,每次期中分析时的界值为一常数C,即:每次期中分析的名义检验水准 a′(i)相同。该法的最大优点是使用方便,尤其适用于药物的安全性评价。

    3.1.2 1976年,Peto 提出每次期中分析时以较大值,如:3.305 作为临界值,而最后一次分析时用常用界值(α=0.05 时为 1.96)

    该法每次期中分析的名义检验水准 a′(i)=0.001,所以可进行多次期中分析而保持总 I 类错误。

    3.1.3 O-F界值法 1979年 O'Brien&Fleming 根据数值积分法,利用 Ui=U(oB)×计算出一单调、递增名义检验水准序列。ZOB经积分可得。当N=5 时,ZOB近似等于 1.96 该法的最大优点是期中分析的界值随检验次数的增加而逐渐减小,名义检验水准 α'(i)逐渐增大,到最后一次检验时, α'(i) 近似等于 α。图1给出了当 N=5,α=0.05(双侧)时,三种成组序贯期中分析的临界值。在此情况下,对所有期中分年,Pocock 界值为 2.14;O-F 常数为 2.04,因此,每次期中分析对应的界值为 2.04,值得注意的是,对最后一次分析 K=5 时,临界值 2.04 非常接近于 0.05 对应的界值 1.96;Peto 法中,前四次分析界值都为 3.305,最后一次分析时界值为 1.969,几乎等于 0.05 所对应的界值 1.96。
, http://www.100md.com
    图1 N=5 α=0.05(双侧)成组序贯设计期中分析界值

    在临床试验中,以上 3 种成组序贯期中分析方法在使用上各有所长,但它们在试验设计阶段必须指定两个变量。

    (1)计划进行多少次显著性检验——期中分析次数 N。

    (2)每两次之间评价患者数——每组样本例数 2n。

    3.2 α消费函数法(α-Spending Function)[6] Lan-Demets(1981 年)提出用 α 消费函数进行期中分析。其基本思路如下:指定一随时间 t*(t*∈[0,1])单调递增的函数a*(t*),且满足条件α*(0),α*(1)=α。总的 I 类错误 α 被看作是信息时间 t* 的连续函数而被消费,也就是每次期中分析消费总 α的一部分。t*表示时间 t(t∈[0,T])时的信息时间,即在时间 t 时观察到的信息占总信息的比值。T 为试验计划终止时间。例如:iK 表示第 k 次期中分析观察到的信息,I 表示试验终止时的总信息,则在 tk 时信息时间表示为 t*k=ik/I。对于均数的比较 t*k=nk/N,即:tk 时观察到的样本例数与总例数的比值。T 为试验计划终止时间。
, http://www.100md.com
    Lan-Demets(1981 年)提出以下五种 α 消费函数: (1)

    式中:表示标准正态分布函数。

    α*2(t*)=αln{1+(e-1)t*} [0,1] (2)

    α*3(t*)=αt* [0,1] (3)

    α*4(t*)=αt*3/2 [0,1] (4)

    α*5(t*)=αt*2 [0,1] (5)
, 百拇医药
    a*(tk)-a*(tk-1)表示第 k 次期中分析消费的 I 类错误率。

    给出了第一α消费函数消费总 I 类错误的情况,α*1 消费函数产生的界值类似 O-F 界值,α*2 消费函数产生的界值类似 Pocock 界值。

    在实际工作中,可针对不同的临床试验选择不同的 α 消费函数。

    图2 α消费函数

    4 国内外期中分析方法研究的现状及展望[7~10]

    英国在期中分析方法研究及应用方面居于世界前列,在国外一些发达国家,任何一种新药的上市,必须通过专业统计人员正规的统计学分析,认为有效才能出售,而期中分析是一种行之有效的统计学方法。
, 百拇医药
    近年来,随着期中分析方法的推广,其研究范围进一步扩大,主要体现在以下几个方面:

    4.1 多终点(multiple Endpoints) 期中分析方法研究始于单一终点数据,而在许多临床试验中,患者对处理的应答有几个测量值(如:毒性、死亡率、疾病缓减期等)。此时,可能某些变量有显著性而另外一些变量没有显著性,因此,很难选择单一变量作为基本终点。

    4.2 估计(estimation) 包括点估计和区间估计。

    在结果报告中以假设检验作为停止原则的基础,但不应排除估计法的作用。其关键是当给出处理差别的估计值时,对累积数据的重复检验如何进行校正。

    对于多终点试验期中分析,可信区间的估计更复杂。是否应对每一终点计算单变量可信区间?是否应建立多维椭球?很显然,在临床试验中需对区间估计这一问题作进一步研究。
, http://www.100md.com
    4.3 分层期中分析 在现有期中分析过程中,很少进行分层分析,其原因有二:①为了分析简单。②在非分层分析中应用分层随机化可扩大可信度,且在试验早期,样本例数较少,使分层分析尤为困难。

    4.4 多处理组试验 期中分析方法始于两处理组的比较,而在实际工作中经常会遇到多处理组的比较。

    对于以上四个方面,国内外学者已经提出一点观点,但尚未形成定论,有待于近一步探讨和研究。

    在我国,临床试验中期中分析方法的研究起步较晚,80年代以后才逐渐被人们认识,但应用的报道尚少见。在临床试验过程中,进行有计划的期中分析可有效的早期终止试验,既可缩短临床试验时间、减少病人的医疗费用且符合医学伦理道德准,而我国人口众多,这就显得尤为重要。另外,期中分析方法简单、易行,值得在临床工作中近一推广、应用。

    作者简介: 郭静,女,1973年4月生,博士(在读)
, 百拇医药
    参考文献:

    [1] Pocock SJ. Statistical problems in the reporting of clinical trials:a survey of three medical journals[J]. N Engl J Med, 1987,13:426.

    [2] Armitage P, Mcpherson CK, Rowe BC. Repeated significance tests on accumulating data [J]. Statist Soc A, 1969,132~244.

    [3] Pocock SJ. Group sequential methods in the design and analysis of clinical trials[J]. Biometrika, 1977, 64 (2): 191.
, 百拇医药
    [4] O'Brien PC, Fleming TR.A multiple testing procedure for clinical trials[J]. Biometrics, 1979, 35: 549~556.

    [5] Peto R. Design and analysis of randomized clinical trials requiring prolonged observation of each patient. 1 Introduction and design[J]. Br J of Cancer, 1976, 34: 585.

    [6] Lan KKG, Demets DL. Design and analysis of group sequential test based on the type I error spending rate function[J]. Biometrika, 1987, 74 (1): 149~154.
, 百拇医药
    [7] Pocock SJ, Gekker NL, Tsiatis M. The analysis of multiple endpoints in clinical trials[J]. Biometrics, 1987, 43: 487~489.

    [8] Bauer P.Multiple testing in clinical trials statistics in medicine[J]. Biometrics, 1991, 10: 925~2715.

    [9] Whitehead J.Sequential designs for equivalence studies. Biometrics, 1996, 15: 2703~2715.

    [10] Jennison C. Efficient group sequental tests with unnredictable Group size[J]. Biometrika, 1987, 74 (1): 155~165.

    [收稿日期: 1999-08-23], http://www.100md.com