当前位置: 首页 > 期刊 > 《实用医学杂志》 > 2000年第8期
编号:10218536
临床诊断性试验研究的正确方法及评价原则
http://www.100md.com 《实用医学杂志》 2000年第8期
     作者:刘续宝 王家良

    单位:610041 成都市,华西医科大学第一临床医学院临床流行病教研室

    关键词:

    实用医学杂志000802 面对就诊的病人,为获得疾病的诊断,通常需要采用大量的诊断性试验,并花费大量的时间和精力对这些临床诊断信息进行判断,使得临床医师常常感叹诊断过程本身的复杂和费时。实际上对临床诊断试验的使用和解释有一些基本原则,如果临床医师熟悉这些原则,有选择地使用诊断性试验,往往能简化诊断的过程,并获得对诊断性试验结果的合理解释,这些原则就是下面要讨论的内容。本文所讨论的诊断性试验的原则不仅仅限于实验室诊断,也适于影像学诊断和根据病史、查体所获得的临床信息而作的临床诊断。

    1 诊断性试验设计的基本原则

    诊断性试验的结果和实际疾病的关系可以用简单的四格表表示,如图1。
, http://www.100md.com
    图1 诊断性试验结果与疾病状态的关系

    1.1 确定金标准 诊断性试验的准确性评价依赖于对疾病存在与否的准确性分类,即了解受试者的疾病实际存在情况是诊断性试验评价的前提。而能提供公认的疾病准确分类的诊断标准称为“金标准”(也称为标准诊断),如果金标准选择不恰当,则整个试验的评价即失去了准确性的基础。金标准通常包括病理诊断(组织活检和尸体解剖)、手术探查及发现,特殊的影像学诊断如冠心病诊断采用的冠状动脉造影,以及因缺乏特异性诊断方法而采用的医学权威机构颁布的综合诊断标准。对一些慢性进展的非自限性疾病,使用标准诊断可能风险太大,在数月或数年的随访过程中疾病的表现可能变得明了,从而获得诊断,对这部分疾病随访的结果也可以作为金标准。

    为什么已有标准诊断还要进行相关诊断试验的研究?的确有时金标准本身就是相对操作简单、安全、便宜的诊断,如HIV病毒的抗体检测等,但通常大多数的标准诊断如上面指出的金标准多为复杂、有创的危险性较大的诊断方法,而临床医师和病人对简单、安全的方法较之危险性较大、昂贵、繁琐的诊断(即使其准确性较高)更易接受,至少在开始是这样。因此诊断性试验的重要目的之一就是采用较为简单的诊断方法来代替尽管准确性较高、但更为繁琐和危险的诊断方法作出临床诊断。但是须注意,只有在了解错误分类的可能性和错误分类在可以接受的低水平,这个诊断方法才有临床使用价值。
, 百拇医药
    如果金标准选择不恰当,可能会产生什么结果呢?实际临床工作中常常会遇到这样的情况,即疾病的标准诊断复杂或有较大的风险,医师选用了容易得到的、但准确性不高的诊断作为标准,在这种情况下即使待检测的诊断性试验有较高的诊断价值,由于金标准选择的不当,而不能得到证实。因为一部分疾病的测试阳性结果被看作了假阳性,同样一部分非疾病的阴性结果也被作为假阴性。需要指出的是任何被检测的诊断性试验,无论金标准选择恰当与否,其评价的各项指标均不可能优于金标准。

    1.2 确定样本量 足够的样本量是排除机会干扰、如实反映诊断性试验准确性的保证,使评价指标如敏感性和特异性能如实反映诊断性试验的特性。通常随样本量的增加,真正反映试验的评价指标的准确性也增加。比如,在只有10个受试对象时,观察到的敏感性为0.75,由于机会的作用,敏感性可能高到1.00,也可能低至0.45,随着样本量增加,95%的可信区间的范围逐渐变窄,样本量达到30个时,可信区间的上限降为80%,下限升为60%,此时随样本量的增加,可信区间变窄的幅度明显减缓,因此样本量应至少在30个以上,才能保证结果受机会影响的程度在能接受的范围。
, 百拇医药
    1.3 选择研究对象 研究对象应为临床病例,包括按照金标准划分研究疾病的疾病和非疾病两类人群。众所周知,疾病的典型与否与诊断有很大的相关性,典型的病例往往更易出现试验的阳性反应,临床易于诊断,相反非典型病例则难以作出临床诊断,可能试验反应也易出现阴性结果,因此受试病例应包括相当比例的早期、轻型等可能临床非典型的病例;而非疾病人群也应包括相当比例的容易与研究疾病相混淆的其他疾病的病例,这些病例可能存在与研究疾病相同或类似的症状和体征,而单纯临床诊断难以区别,极易发生误诊。只有包括了上述这些研究对象的试验结果才可能具有对研究疾病的代表性和鉴别诊断的价值。

    1.4 试验结果与金标准分类结果比较 临床关心的是疾病的有无、试验结果的阳性或阴性,这也正是采用四格表对诊断性试验的各项指标进行评价的基础。目前大多数诊断方法、特别是实验室诊断多为定量结果,对这种连续变量首先需要确定阳性和阴性的临界值,即对受试对象的诊断指标数据确定参考值,实际上就是将数据简化为直接用于临床的结果,然后将试验结果即阳性和阴性结果和金标准分类结果填入四格表进行诊断性试验属性分析,如表1,通常包括敏感性、特异性、准确性和似然比等,从而判断试验的精确性。参考值的确定根据数据的统计学分布,常用的有均数加减标准差、百分位数等方法,也可利用受试者工作曲线进行确定,当然有些临床参考值是来自长期的临床实践,是对产生疾病后果的危险性大小认识的结果,如高血压的参考值。
, 百拇医药
    2 诊断性试验指标的评价

    表1总结了诊断性试验结果和疾病实际存在状况的关系,评价这种关系通常采用一些指标,这些指标对诊断试验的准确性有重要意义,分述如下。

    表1 诊断性试验结果评价 新的诊断试验

    诊断结果

    金标准诊断结果

    阳性

    阴性

    阳性

    a

    b

    阴性
, 百拇医药
    c

    d

    2.1 敏感性和特异性 敏感性[a/(a+c)]是疾病人群中阳性试验结果的比例,一个敏感的试验将有较少的漏诊率。特异性[d/(b+d)]是非疾病人群在试验中显现阴性结果的比例,特异性的试验较少发生非疾病人群的试验阳性,即误诊率较低。故而诊断性试验提供敏感性和特异性指标是评价试验优劣的基础。理想的诊断性试验是具有高的敏感性和高的特异性,而在实际情况中这是不可能的,任何提高敏感性的做法均是以牺牲特异性为代价的,反之亦然。因此对连续变量数据确定正常和异常的临界值有时很矛盾。通常做法是以产生漏诊和误诊之和最小时的数据值确定为临界值,此时的准确性最大,但这种方法有时缺乏临床实用性。因此我们建议临界值的确定应考虑诊断性试验的目的、漏诊或误诊给患者带来的损害程度和患病率的高低等因素,如果漏诊会给患者带来无法挽回的损失,即诊断的目的是减少漏诊率,则应选择有助于提高敏感性的临界点,相反,则应考虑提高特异性的临界点。
, 百拇医药
    2.2 似然比 是描述诊断性试验特性的另一种方法,反映了特异性和敏感性两个方面的特性。阳性似然比{a/(a+c)/[b/(b+d)]}指试验结果为阳性时受试者患有相应疾病概率与未患疾病的概率的比值(即真阳性率/假阳性率),其强调对一阳性结果真正患病的概率大于未患病概率的倍数。反之,阴性似然比{c/(a+c)/[d/(b+d)]}指试验结果阴性时,受试者患有疾病的概率与确实无病的概率之比,即患病的概率小于无病概率的倍数(假阴性率/真阴性率)。因此阳性似然比越大或阴性似然比越小,疾病诊断的准确性越高,即阳性结果反映疾病存在的可能性越大,而阴性结果反映无病的可能性越大,尤其适于对多项试验的综合评价。

    2.3 预测值 是试验结果出现时,受试者的患病概率,虽然不能反映该试验的准确性,但是临床医师所关心的问题,对实际使用有参考价值。阳性预测值[验后概率,a/(a+b)]为试验结果阳性的受试者中的患病率或阳性结果时的一个受试者的患病概率。阴性预测值[d/(c+d)]为试验结果阴性的受试者中真正无病率或试验结果阴性时的一个受试者的真正无病概率。由于其受敏感性和特异性的影响,也受试验对象中患病率的影响,因此在介绍预测值时,应告之受试者的患病率。故在不同层次的医院,应诊患者中患病率存在显著的差异,同一诊断性试验的使用价值也不同,所以是否开展此项检查应考虑不同患病率下的预测值,否则可能造成医疗资源的浪费。
, http://www.100md.com
    2.4 ROC曲线和ROC曲线下面积 ROC曲线是对连续性资料而言的,是以(1-特异性)为横坐标,以敏感性为纵坐标所绘制的曲线。ROC曲线与对角线间的面积反映了试验的准确性,面积越大,准确性越高,这对两个以上试验的比较有很大的意义。同时ROC曲线也被用来选择正常和异常的临界值时作参考。

    3 诊断性试验常见偏倚

    有时在评估诊断性试验时,如敏感性和特异性等指标在建立过程中并不是采用独立或盲法进行的,而是与疾病的确诊过程同时进行,对试验结果阳性而临床也怀疑有病的病例,可能会进一步检查,并可能获得疾病的诊断,即是说增加了疾病获得诊断的可能性。相反阴性试验结果可能使临床试验者放弃进一步的工作,如果疾病确实存在,则增加了漏诊的可能性。

    另外一种偏倚常发生在放射诊断中,即把试验结果作为确立诊断的临床依据的一部分,或者把最后的诊断或其他临床信息带入作为得出试验结果的考虑的依据。因为阅读X线片时容易受到所提供的临床信息的影响,可能因为临床提示,反复阅读或对先前不知道临床信息(包括症状、体征和其他检查结果)时阅读的X线片重新阅读而发现忽略的阳性表现,这种偏倚增加了诊断性试验结果和金标准结果的一致性,从而夸大了其准确性和使用的价值。因此试验的评价应独立进行,同时与金标准的比较也应盲法进行,避免因偏倚因素造成诊断性指标的错误或不恰当的评估。
, http://www.100md.com
    4 选择诊断性试验

    选择诊断性试验,实际上就是评估各种诊断性试验的临床价值和实用性,针对这个目的,加拿大McMaster大学临床流行病及生物统计教研室提出了评估临床诊断性试验实用价值的8 条指标:(1)是否与金标准进行了盲法比较?(2)研究对象的受试疾病患者是否包括了轻型、重型和治疗、未治疗等各型病例,受试非疾病对象是否包括了与研究疾病极易混淆的其它疾病患者?(3)试验评估的地点(如基层普通门诊、三级医院的专科门诊)和筛选的病人和选用的对照是否有明确的交代?(4)试验结果的重复性(包括同一组研究对象的重复测试结果和其它研究者的重复结果)如何?(5)参考值的确定是否明确和恰当?(6)如果是一组多项试验的结果,那么每项试验对多项试验结果的影响是否做了评价?(7)是否对试验的细节做了其他人可以重复的详细介绍?(8)临床的实用价值如何?

    需要指出的是临床医师不能把诊断性试验或为获得诊断而收集的相关诊断信息(数据资料)仅仅局限为实验室、放射影像或病理的检查,而忽略完整病史的采集和细致的体检。事实上相关的病史和体征往往比实验室或影像学的结果对诊断的贡献更大,常常可以做出明确的疾病诊断,而实验室或影像学等提供的诊断信息通常是以临床工作为基础的,因此不能成为诊断过程中的主体。另一方面为达到确诊疾病目的所收集的诊断信息或进行的诊断性试验,也可以用于判断疾病严重性、预测疾病临床过程或病人预后、估计对即将进行治疗的可能反应和测定对目前所进行的治疗的真实反应等目的。

    5 参考文献

    1,Department of clinical epidemiology and biostatiostics,McMaster University. How to read clinical journals:Ⅱ.to learn about diagnostic test. Can Med Assoc J,1981,124(3):703.

    (收稿日期:1999-12-20), 百拇医药