当前位置: 首页 > 新闻 > 信息荟萃
编号:114509
临床治疗性研究的设计与评价
http://www.100md.com 2001年10月4日
     临床治疗性研究是临床医学研究中最为活跃和实用的部分。据中华内科、外科、妇产科和儿科四种杂志1997年度发表的406篇学术论著的统计,其中治疗性研究的论著为122 篇,平均占论著的30%(9%~73%)。临床治疗性研究在于提高临床治疗水平。由于疾病的复杂性,而人们的认识水平和对疾病的干预又受到科学水平的制约,因此,对疾病的认识-干预-效果等三个方面需要不断地深化和提高。为了提高治疗性研究的科研设计水平,本文将着重介绍治疗性研究的基本原则与方法,并结合有关论著的实例,作初步探讨。

    一、关于治疗性研究的决策基础

    1.治疗性研究的目的:鉴于临床各类疾病的复杂性,临床医学对疾病的认识和治疗又受着当前科学发展水平的制约。因此,应根据被研究的疾病的具体情况,以科学的态度决策研究拟达到的最终目的:是可以治愈或根治;是为了有效地防治并发症、预防复发、降低病死率;抑或仅仅缓解现症,维持机体的功能和改善生存质量等等。对不同质的疾病所达到的治疗目的,显然有质的差别,故在确定研究目的的时候,不可混淆。
, 百拇医药
    2.采用的治疗性研究措施的条件:对任何拟投入临床治疗性研究的药物或措施,在决策时一定要占有充分的药理、毒理、药效学等生物学依据以及临床试验一期的可靠科学资料,证明安全、有效,注重医德和法律,同时还要考虑技术和经济的可行性。

    3.设计达到最佳的治疗有效水平:根据不同性质的疾病及其病损程度、机体的代偿机能、治疗措施本身的效能和反应,以决策可能达到最佳的治疗有效水平,过高或过低都可能影响到科研及治疗的质量。

    二、治疗性研究设计的基本要素

    1.研究设计的方案要科学:治疗性研究通常都是前瞻性的研究。在研究方案的设计上,必须要坚持三条基本原则:(1) 随机化的原则(randomization)。(2) 对比原则(comparison),设置对照组;(3) 盲法原则。符合上述三原则者,首推随机盲法对照试验(randomized blind controlled trial, RCT),是治疗性研究设计首选的金方案[1]。
, 百拇医药
    临床随机治疗性对照试验以中小样本量为多,为保持良好的可比性,可采取分层随机法分组。对于分层因素选择的原则是:(1) 与疾病或重要并发症的发生有重要关系的危险因素;(2) 与治疗效果及预后有明显影响的某种临床特点;(3) 分层因素应精选并控制到最小量。例如,有一研究报道[2]分层随机对照试验,其中分层因素有6个,如果在试验组和对照组中每组最低维持有1名分层后的亚组患者的话,则两组共需128例(26=64亚组),可该文的总例数只有61例,且两组病例数亦不相等。另外,我国临床随机对照试验的报道基本上对随机分组的具体方法交待欠详,往往只用“采用随机对照方法”一句话表示,而细读后发现有的试验组与对照组的病例数不详[3]。有的研究在随机分组后的组间临床特点的基线状况差异太大,可比性不好,影响研究质量[4]。

    2.研究的对象诊断必须准确:治疗性研究的对象必须符合公认的临床及有关金标准诊断。此外,根据课题研究的目的,分别制订出纳入标准及排除标准,以选择合格的对象进行试验。入组的研究对象的准确诊断,是保证研究质量的最重要和最基本的条件,在研究设计和发表的论著中务必详细交待。例如,有些大型多中心研究的论著文章,对入组的研究对象的诊断标准却存在着某种缺陷[5,6]。
, 百拇医药
    3.试验样本需要量的估算:在治疗性研究的试验组及对照组中,各组究竟需要多少病例才能达到预期的研究设计要求,要根据课题设计的有关参数进行计算。(1) 试验组与对照组具显著性临床疗效差异水平的假设;(2) 限定Ⅰ型(α)错误为0.05和(Ⅱ)型(β)错误为0.1~0.2,则检验效能(power)为0.9~0.8。根据这些基本设计参数,应用有关公式计算出各组所需要的试验样本量[2]。

    4.试验效果测试指标的要求:(1) 作为测量治疗反应的方法和指标,要求① 敏感性要好:对于治疗出现的客观反应,要能敏感地发现并能量度,其敏感性越高越好;② 特异性要强:对治疗反应的阳性结果要能准确地测量和确定。其特异性越强越好;③ 经济可行:在考虑敏感性和特异性的基础上,应从多种方法比较中,选择经济及可行性良好的测试方法和指标。(2) 测试的指标,应依治疗试验的终点目标而定:① 如治疗的终点目标是降低病死率和非致死事件发生,则测试指标定为病死率、生存率以及非致死事件发生率;② 验证治疗措施本身的有效性:根据临床公认的有效、无效的效果判断标准,精选有关临床及实验室的定量及定性指标予以测量;③ 指标的选择要少而精,如选择越多,则假阳性的概率发生就越大,会影响疗效测试的真实性。
, 百拇医药
    5.治疗观察的期间要合适:治疗观察期间,要在基础研究的基础上,参考临床达到治疗最佳水平的时间而定,要注意近期和远期疗效的观察。如观察期间过短,易致假阴性或假阳性的结果,过长也会消耗过多的资源。

    6.制订防止偏倚的措施,确保研究的真实性:各种偏倚因素会歪曲研究结果的真实性。因此,在治疗性研究方法中,一定要有相应的预防和处理的措施。如防止选择性偏倚,使用随机抽样与随机分配法;避免测量偏倚,使用盲法;减小机遇因素的影响,采用限制Ⅰ型及Ⅱ型错误水平的方法;有的混杂因素可通过配对及统计分层分析法加以避免或处理;通过严格培训人员,严格实验仪器、条件和方法以防止混乱;通过医学知识教育,改善医疗服务环节,以促进患者的依从性等。这些措施和方法均应贯穿整个设计、执行和资料分析的全过程,保证研究的高质量,从而获得科学的结论。

    7.正确地选用统计学方法整理与分析资料:在临床科研设计阶段,可能期望在未来的试验中获得哪些试验的资料和数据,它们又将怎样地被利用来分析和评价研究的结果,这就要涉及在研究设计中如何考虑科学地应用统计分析的方法,而不是在试验终结面对各种资料时才加以考虑,否则必影响研究的质量。
, 百拇医药
    三、影响治疗性研究质量的有关偏倚因素

    1.选择性偏倚(selection bias):主要是研究对象的选择和分组时,由于人为的干预而导致的偏倚,防止的方法只有用随机抽样和随机分组法。

    2.测量性偏倚(measurement bias):主要是测试研究结果时,受人为倾向因素的影响而造成的偏倚,从而歪曲真实性,防止的方法应实施盲法测量。

    3.干扰(co-intervention):是指试验组的对象额外地接受了类似试验药物的某种有效制剂,从而人为地造成一种夸大试验组疗效的一种假象。

    4.沾染(contamination):是指对照组的患者额外地接受了试验组的药物,从而人为地造成一种夸大对照组疗效的虚假现象。

    5.霍桑效应(Howthorne effect)[7]:在治疗性研究中,研究者对自己感兴趣的研究对象较对照者往往更为关照和仔细;而被关照的患者对研究人员又极可能报以过份地热情,从而对治疗反应报喜不报忧。这种人为地引起夸大客观效果的现象,谓为“霍桑效应”。
, 百拇医药
    上述干扰、沾染以及霍桑效应的克服办法有赖于双盲或三盲的盲法治疗设计。

    6.均数回归现象(regression to the mean)[8]:有些测试的指标,如血压或某些生化指标在初试时有些患者可以在异常水平,然而,在未干预或无效治疗的条件下复试,可能有些回复到正常水平。它可以造成误为治疗有效的假象。克服的办法可以采取对同一个体的有关测试指标,进行不同时间的多次测定,取其均值以排除其干扰。

    7.机遇(chance):即随机误差或抽样误差所致的偏倚。机遇因素在治疗性研究中不可能消除,只能在研究设计中,通过限制Ⅰ型错误和Ⅱ型错误的允许水平,使机遇因素的影响控制在容许的范围之内。

    8.混乱(noise):混乱是指“研究”工作杂乱无章,以致造成研究的结果十分不科学和不可靠。

    9.依从性(compliance):依从性是指病人执行医嘱的客观应答反应的程度。全面认真地执行医嘱,按规定的药物剂量和疗程接受治疗者,称为依从性好,反之,则是不依从(non-compliance)或依从性不好。患者的依从性肯定会影响研究质量,不依从率应力争控制在10%范围内。
, 百拇医药
    四、治疗性研究质量评价的原则与方法[1,8,9]

    治疗性研究的质量评价,着重其真实性和可靠性以及临床治疗的实用性。

    1.治疗性研究是否是真正的随机对照试验:随机对照治疗性试验是“金方案”研究的结果,其真实性及可靠性较其它设计方案的结果为佳。即使是RCT的研究结果,评价质量时亦要注意以下问题:(1) 盲法更能提高RCT的真实性,包括盲法治疗与资料的盲法分析。(2) 要注意组间重要临床特点基线状态的可比性。(3) 要高度注意试验组或对照组除了接受各自的试验措施外,是否还接受了其它不同程度的辅助治疗。注意“干扰”及“沾染”偏倚影响研究的结果。(4) 是否交待了真正的随机法,注意分组对象的数量及临床特点的一致性。

    2.对入组研究对象的诊断标准是否确切、可靠或公认,有否明确的纳入和排除标准。这些都有利于评价研究成果的真实性和代表性。
, 百拇医药
    3.纳入试验的全部对象是否完成了全部治疗:在研究的结论中是否纳入了全部入组时的病例?不依从或丢失的病例,应作相应地交待。为了评价研究结果的真实性,对于试验组和对照组丢失的病例可分别采用以下方法处理:(1) 试验组的丢失病例全部作为“无效”计算。(2) 对照组的丢失病例全部作为“有效”计算。然后,再将两组结果进行比较。如结果仍有显著性意义,则可下肯定的阳性结论,否则,要作进一步探讨。

    4.有关研究结果是否全部作了报告:(1) 疗效:效果程度及组间疗效值的比较,是否有充分的科学依据,真实可靠;(2) 药物不良反应:组间药物不良反应的发生率及其严重程度的报道是否真实和全面。

    5.治疗结果的临床及统计学意义如何:在明确临床治疗反应的有效及副反应发生率的基础上,对于试验组和对照组之间的疗效差异水平要客观地分析和评价。(1) 关于临床意义的评价,可采用以下指标:① 相对危险降低率(relative risk reduction, RRR):对照组(P)与试验组(A)事件发生率之间的差值(P-A)再被对照组的事件发生率去除,所得商值的%表示[(P-A)÷P ]=RRR。通常RRR在25%~50%或以上,临床意义方有价值。② 绝对危险降低率(absolute risk reduction, ARR):为对照组(P)与试验组(A)事件发生率的绝对差值(P-A)=ARR,用%表示。③ 需要治疗的人数(number needed to treat, NNT): 即为了挽救一个病人免于发生严重的临床事件,需要治疗具有发生此类危险性患者的总人数,计算公式=1÷ARR=NNT。(2)对试验结果的统计学意义评价:当临床治疗性试验的结果具有临床意义时,则应作统计学的显著性检验,以帮助判断临床意义的真实程度。统计学的差异仅仅表示临床试验中发生假阳性和假阴性的概率或程度,这类错误越小,则统计学差异越显著。显然,这种统计学的信息并不能代替临床研究结果的价值。(3) 对研究的结果是否作了卫生经济学的分析与评价?
, 百拇医药
    6.治疗对象的特点是否作了仔细描述?纳入治疗对象的临床特点如病情的程度、病程的长短、合并症的有无等,社会及人口学的特点等,要尽可能地详述,以便他人对照其自己的病人状况及医疗环境,批判性地应用。

    7.对于试验治疗的方法或措施,在方法学部分要作详细交待。用药途径、剂量、疗程、药量的增减条件,可能出现的药物不良反应及其对策,以及中止试验的标准,都应写清楚。

    上述7条基本原则,可供治疗性研究设计与质量评价的参考。

    作者单位:610041 成都,华西医科大学第一附属医院临床流行病学资源与培训中心

    参考文献

    1 王家良主编.临床流行病学——临床科研设计、衡量与评价.上海:上海科学技术出版社.1990:74,114,120,123~125,150,205.
, http://www.100md.com
    2 胡伏莲,贾博琦,陈宝雯等.国产呋喃硝胺和甲氰脒胍对十二指肠溃疡短期疗效及抑酸效果比较.中华内科杂志,1987,25:486-488.

    3 刘文忠,吕宝妹,肖树东等.克拉霉素的短程三联疗法根除幽门螺杆菌.中华内科杂志,1996,35:803-805.

    4 陈寿坡,陈志强,贝濂等,奥美拉唑、克拉霉素和羟氨苄青霉素根除幽门螺杆菌疗效的观察.中华内科杂志,1996,35:799-802.

    5 “八五”国家攻关课题(85-915-02-01)研究组.急性心肌梗塞尿激酶临床应用研究(1 138例). 中华心血管病杂志,1996,24:169-172.

    6 尿激酶(天普洛欣)多中心临床试验协作组.尿激酶治疗急性心肌梗塞多中心临床试验1 406例总结.中华心血管病杂志,1997,25:176-179.
, 百拇医药
    7 Fletcher HR. Fletcher SW,Wagner EH,eds. Clinical epidemiology. the essentials. ed 3. Baltimore: Williams & Wilkins, 1996:39.136,143.

    8 Sackett DL Haynes RB. Guyatt GH,et al: Clinical Epidemiology.a basic sciences for clinical medicine. ed 2. Boston:Little Brown, 1991.187.

    9 Sackett DL, Richardson WS, Rosenberg W, et al.Evidence-based medicine. London:Churchill Livingston,1997:91, 105, 133.

    --《中华医学杂志》1999,No2, http://www.100md.com