临床研究中的偏倚及其控制方法(专题笔谈)

临床研究中的偏倚及其控制方法

http://www.100md.com 《实用医学杂志》 2000年第8期

     作者：董碧蓉

    单位：610041 成都市，华西医科大学第一临床医学院临床流行病学教研室

    关键词：

    实用医学杂志000805 临床科研中的误差主要有两类：抽样误差与系统误差。抽样误差又称随机误差或变量误差，由抽样样本的变异性造成，与样本大小，研究对象之间的差异大小有关，可以通过统计学方法进行估计及增加样本量后，误差就可减少，因此在临床研究中容易得到控制。系统误差是研究者所得出的结果与真实的结果之间的误差，称为偏倚(bias)。目前不少临床研究难以重复，缺乏真实性，偏倚就是造成歪曲研究结果的真实性和重复性的主要原因。

    偏倚是人为造成的误差，是由于研究对象的选择、资料收集、观察指标与观察方式的确定等诸方面所使用的方法或标准不恰当所致。例如比较甲药与乙药对某种疾病的疗效，结果显示甲药疗效比乙药好。一种可能是该结论是真实的，另一种可能是偏倚所致。由于病例分配上存在不一致，服甲药的人健康情况、年龄、病情等均较服乙药好，两组病人在临床特征上有差异，基线不一致；甲药味道好、剂量小或副作用少，病人更愿意服用，依从性高；因甲药是新药，研究者和病人对此药期望更高，观察更仔细，会更精心地治疗和关心甲药组，也得到病人更好的合作和反应；衡量疗效时，对甲药组不愿放过微小的改善加以记录，而对乙组可能视而不见；结果分析处理时，可能过分注重甲药组的微小改善，并予夸大造成偏倚。
, http://www.100md.com
    由上例可见，偏倚贯穿于整个研究过程，从研究设计到实施，以及最后的资料分析和结论推导都可能产生。而且任何研究类型，无论是病因学探讨，还是诊断试验，以及临床疗效观察和预后研究，都普遍存在偏倚的干扰。各种研究设计，除严格的随机对照试验，安慰剂对照加双盲的观察方法，能够有效地控制已知的偏倚外，其它如队列研究，病例对照研究，描述性和分析性研究，均不可避免地存在偏倚的影响。偏倚不仅可以因为观察者或病人双方的主观原因造成，亦可因为研究者对某些因素的影响不了解，无意中忽略了其作用所导致^[1]。

    偏倚与随机误差不一样，随机误差是围绕着真实结果的上下左右移动，差距不大，而偏倚产生的误差具有方向性，可以远离真实结果，其偏离的大小和方向，取决于偏倚的特点和严重程度。由于在医学科研中，常常不了解研究结果的真值，没有“金标准”相对比，所以无法确定偏倚的大小，并且除混杂偏倚外，其它种类的偏倚不能用统计学方法处理来加以控制与纠正，因此如果研究中没能有效地控制和排除偏倚，将使研究结果失去临床价值，导致临床研究的失败。可见在设计和实施中防止偏倚十分重要。
, 百拇医药
    目前，国内外对偏倚尚无统一分类法。在临床流行病学中，先后已总结出100多种偏倚。根据研究中出现的阶段不同，主要分为三大类：选择偏倚，信息偏倚及混杂偏倚。选择性偏倚出现在研究开始阶段，信息偏倚出现在研究实施阶段，混杂偏倚主要出现在结果分析阶段。

    1 选择偏倚

    由于选择的研究对象不能代表目标人群或不正确地选择了研究对象组成试验组和对照组，使两组研究对象存在除研究因素外的其它因素分布的不均衡性引起。各类研究设计均可产生该类偏倚。在病例对照研究中，入院率偏倚或称就诊机会偏倚(berkson's bias)就最常见。因为病例对照研究往往不能在目标人群中把符合条件的病人都检出纳入病例组，非病人纳入对照组，常常只能在医院选择研究对象，若对照选自医院的其它病例，可因入院率不同，入院者的危险因素在身患数病的患者会更多，从而夸大或掩盖某暴露因素与疾病的真实联系。例如A，B两病在人群中各有6 000例，他们的吸烟率均为20%，故吸烟者两组均各为1 200例，不吸烟者也各为4 800例。但他们患病后的入院率却不同，不吸烟者A病入院率为60%，B病却为25%；而吸烟者的入院率两组均为40%。因此两病的吸烟与不吸烟者的入院构成情况如下：
, http://www.100md.com
    A病：不吸烟的住院人数＝4800×60%＝2880例

    吸烟的住院人数＝1200×40%＝480例

    A病总住院人数＝3360例

    A病住院的吸烟者占A病住院人数的百分率＝14.3%

    B病：不吸烟的住院人数＝4800×25%＝1200例

    吸烟的住院人数＝1200×40%＝480例

    B病总住院人数＝1680例

    B病住院的吸烟者占B病住院人数的百分率＝28.6%

    因此，不但B病入院者中吸烟率显著高于A病入院者中的吸烟率，而且亦显著高于人群中B病患者的吸烟率。如将住院者用来研究吸烟与致病关系，显然会夸大与B病的联系。而事实上A病和B病与吸烟的联系并无差别。其差别是因入院率不同而造成的。
, 百拇医药
    在病例对照和现况研究中，调查到的只是存活病人，不包括死亡、亚临床型、轻型病例或痊愈者，从而可使研究结果产生偏倚，称患病率及发病率偏倚或Neyman's偏倚。例如进行心肌梗塞的研究，由于急性心肌梗塞早期死亡率高，这部分死亡病例常不能纳入研究，无症状性心梗、亚临床型，甚至临床型心梗，随着病后心电图恢复正常，也常漏掉未包括在研究中，从而导致这类偏倚^[2]。若某病的幸存者因疾病或其它因素改变了生活习惯，从而降低了某危险因素暴露水平和在调查时夸大和缩小了病前生活习惯上的某些特征，亦可产生此类偏倚。如著名的Framingham队列研究，探讨冠心病与高胆固醇血症的关系，发现高胆固醇患冠心病的相对危险度(RR)为2.4，而在病例对照研究，两者关系的RR仅为1.16^[2]。由于队列研究是客观地观察了暴露于危险因素的频率和程度，可以避免这种偏倚。

    又如关于体力锻炼与冠心病间关系的队列研究，入选的参加锻炼者，可能平均血脂水平较低，冠心病的阳性家族史及肥胖者较少；而不参加锻炼者(对照组)，这些情况都较锻炼组高，由此造成除观察因素(锻炼)外，其它因素在两组分布不均。再如治疗研究，由于病人个体之间在病程、病情、并发症、疗效反应、副作用各方面均不相同，如果根据医生、病人或家属意见，随意分配病人到试验组或对照组，将使两组之间产生严重的选择性偏倚。再如诊断试验，如果选择典型患者作为由金标准确诊的病例组，而选择临床上基本排除有病，甚至健康人作为金标准确诊的对照组，其结果将人为地提高诊断试验的敏感性和特异性，因为如此选择病例会排除假阴性的轻型病人，使敏感性被夸大，而选择健康人为对照，可能会排除假阳性的疑似病人，结果使特异性被夸大。
, 百拇医药
    另一种常见的选择偏倚是无应答偏倚和失访偏倚。无应答偏倚是指研究对象因为各种原因，对研究提出的问题不予回答。造成无应答的原因多种多样，如年龄大，文化水平低、对健康不重视、设计的问题不恰当或涉及隐私等，使应答率低。有研究调查吸烟者习惯，发现不吸烟者应答率高于吸烟者。不同疾病的应答偏倚也不一样，职业病应答率较好，而癌症、传染病(肝炎、结核)、慢性呼吸道疾病、冠心病等应答率较低。若无应答者超过一定比例，将影响研究结果的真实性，至少应答率应达到80%。失访偏倚是无应答的另一种表现形式，常见于队列研究和干预性试验中。由于观察时间较长，有研究对象不能坚持而退出队列、有人迁居、死亡、或药物副作用而停止治疗等，最后统计分析的人数远远少于进入观察的人数。如果失访超过10%，研究结果的真实性将受到影响，若超过20%，则结果不可信。

    控制选择性偏倚采用的方法有：(1)避免Berkson's偏倚的最好方法是采用人群的病例对照研究。亦可选择多个医院的病例，或位于不同研究地区、不同方位，能代表不同水平的若干个医院的病例作为病例组，不同科室的非研究疾病的病人作为对照组，以减少入院率偏倚。还可以设立两个或多个对照组，其中之一来自一般人群，其它来自医院，这样即可代表社区一般人群，又能代表医院内不同类型病人^[3]，然后进行两组基线比较，以判断有无选择性偏倚。(2)选择起病不久的新发病例作为研究对象，可避免Neyman's偏倚。(3)选择对象时要注意选择那些易于随访，依从性高的对象，涉及到个人敏感问题时，不要直接了当，要掌握询问技巧和设计该类问题的技巧。(4)诊断性试验应选择各种临床类型(轻、中、重型、治疗和未治疗)的病例和高度怀疑该病，又易于与其它疾病相混淆的病例，同时进行标准的诊断方法和新诊断方法的检查。(5)采用随机分配使每个研究对象进入各组的机会均等，将不同病情，不同特征的研究对象均衡地分配在各比较组中。(6)治疗试验与队列研究时，要把目标人群尽量缩小，使制定的纳入和排除标准与之相适应，但是在研究结论推广时要慎重，只适用于缩小了的目标人群。
, http://www.100md.com
    2 信息偏倚

    又称测量偏倚和观察偏倚。是在收集资料，观察结果过程中，对两组病人的调查方法不一致造成的系统误差。原因主要有研究对象与研究者各自的倾向性；诊断或结果判断的标准不明确，不统一；收集与观察的方法不恰当，不一致；检测的仪器性能不好，型号不同，标准不一致；既往资料不准确或遗漏等。

    在病例对照研究中，最不容易避免的是回忆偏倚。两组对象回忆过去发生的事或经历，在准确性和完整性方面存在误差。常因为调查的因素或事件发生率很低，未留下深刻印象，记忆模糊或遗忘。也可能病例组因患者对过去的暴露史反复思索，甚至家属也帮助提高线索，以致夸大了暴露情况。而对照组的非病人对调查不够重视，未认真回忆，致使两组提供的资料准确性降低，从而夸大或降低致病因素的暴露水平。例如对有或无类风湿性关节炎的病人，分别询问其有关本病的家族史，患者会有较高的阳性家族史，但用患者亲属中无类风湿关节炎者与对照组再作比较时，这种差异就不存在了。
, http://www.100md.com
    如果观察者事先已经知道研究对象的某些情况(已服某种药物，已暴露于某因素，合并某种疾病等)，会在诊断过程中更仔细地搜寻某种结果，从而产生疑诊性偏倚。例如在研究口服避孕药与下肢血栓性静脉炎的关系的队列研究中，观察者对口服避孕药妇女，会更加频繁和仔细地寻找静脉炎证据，必然会发现更多的病例，尤其是那些病情较轻，需较复杂准确的诊断检查才能确诊的病例，相反，对未服避孕药的妇女，检查欠仔细，造成结果的偏倚。

    在治疗试验中常出现“沾染”与“干扰”偏倚。沾染偏倚是对照组成员意外地服用或接受了试验组的措施或治疗组病人意外服用了试验组的药物，致使最终的结果差异缩小。如在观察阿司匹林预防血栓性疾病的队列研究中，曾有对照组病人因感冒而多次服用了阿司匹林，造成对最终结果的影响。“干扰”是指试验组成员除了所研究的治疗措施外，还加用了其他影响疗效的措施(更细致的观察护理、更好的支持疗法)，或门诊观察的病例，在外同时服用了中药或其他药物治疗，最终结果偏向有利于观察组一方。

    信息偏倚的防止方法有：(1)病例和对照使用相同调查表、同一调查员、相同询问方式和询问时间，最好采用盲法收集资料，以消除研究者和研究对象主观因素的影响。如在病例对照研究中让调查者在不了解研究对象的疾病诊断时去询问和测量暴露史。在队列研究和防治性研究中，让观察者在不了解研究对象的暴露情况和分组状况，以此收集和测量到的阳性结果就能保证其真实性。若在诊断前收集资料，可减少信息偏倚。(2)选择起病不久的新发病例作为调查对象可减少回忆偏倚。(3)各类指标要有明确的公认的标准。在盲法收集资料不可行时，尽可能收集客观的定量指标(利用实验室方法，病例记录等)。(4)对资料收集者，进行统一培训，保证资料收集者之间的一致性，以求达到高的卡帕值。在研究进行中，亦不要随意更改标准，记录要准确。(5)广泛收集各种资料，不但收集详细的疾病资料，还可搜集一些虚变量，即与疾病和暴露关系不密切的资料，以分散调查者和研究对象对某因素的注意力，减少主观因素造成的误差。
, http://www.100md.com
    3 混杂偏倚

    在病因学研究中，当研究某暴露因素与疾病之间的关系时，由于另一个或多个既与疾病有制约关系，又与暴露因素密切相关的外部因素的影响，从而掩盖或夸大了所研究的暴露因素与该疾病的联系。这种影响所带来的误差称为混杂偏倚。那些外部因素称为混杂因素。混杂因素与暴露因素和疾病都有关系，很多非研究因素均可以成为混杂因素，如年龄、性别、民族、职业、疾病临床类型、伴随疾病等。具体的研究有其特有的混杂因素，如研究乙肝病毒感染与原发性肝癌的关系时，食含黄曲霉素食物就是一混杂因素，在两组间应进行平衡。

    混杂偏倚的控制，根据研究阶段不同，可采用不同的方法。设计阶段可采用以下措施：(1)严格限制研究对象，将已知存在混杂因素的对象不纳入研究，规定各比较组在人口学特征上近似或疾病特征上相同。例如，研究年龄对急性心肌梗塞预后的影响，研究对象限制在40～70岁男性，无并发症者。这样限制就控制了年龄、性别、并发症的混杂作用。但如果严格限制研究对象，将影响研究对象的代表性，使研究结果在一般人群中推论受到限制。(2)配对。为每个病例匹配一个或多个对照，除研究因素外，使两组某些可疑混杂因素尽量相同，以此来消除混杂作用。许多因素可作为配对条件，如年龄、性别、种族、血型、入院日期、地区、经济收入水平、血压、职业、个人史、家族史等。常常需结合专业知识决定配对因素。但和研究因素经常并存的因素不可作为配对因素，要防止配对过度而降低研究效率。病例和对照的比例可以1∶1，1∶2，1∶3，1∶4，比例再加大，效益并不提高，反而增加研究难度。1∶4足够，一般以1∶2为最好。(3)分层抽样。在进行人群调查时，先分层，后随机抽样，把混杂因素限定在备选人群中的一个狭窄的范围内。(4)直接随机抽样，适用于大样本的研究设计。随着每个组的例数增大，混杂因素及其它分层条件在组间的差别缩小，均衡性可以增加。
, http://www.100md.com
    分析阶段可采用：(1)分层分析。在设计阶段考虑不周或执行不力，有可疑混杂因素可寻时，可按不同水平分层，再分别用单纯分层分析法或Mentel-Haenszel分层分析法加以分析，层次过多会增加选择符合条件的研究对象的难度和统计难度。(2)多因素分析。应用统计学软件，根据Logistic回归方法，消除混杂因素的影响。

    临床研究的成功与否，与是否有效控制偏倚有关。只有从设计、实施到统计处理等每个环节，严格把关，减少和消除偏倚的影响，才能得出真实的结果，临床研究才具有价值。

    4 参考文献

    1，王家良，主编. 临床流行病学临床科研设计、衡量与评价. 上海：上海科学技术出版社，1992. 77～86.

    2，Sackett DL. Bias in analytic research. J Chron Dis.1979,32(1)：51～63.

    3，徐德忠，主编. 临床科研方法与实例评价. 西安：陕西科学技术出版社，1993. 39～41.

    (收稿日期：1999-12-15), http://www.100md.com

百拇医药网 http://www.100md.com/html/analecta/2000/08/01/09/811.htm