当前位置: 首页 > 期刊 > 《中国应用生理学杂志》 > 2000年第1期
编号:10499337
医学实验中常见设计类型的辨析及统计方法的合理选用
http://www.100md.com 《中国应用生理学杂志》 2000年第1期
     作者:胡良平

    单位:军事医学科学院情报研究所医学统计教研室,北京 100850

    关键词:单因素K水平设计;析因设计;重复测量设计;t检验;方差分析

    中国应用生理学杂志000123 摘要 目的:帮助医学研究工作者提高对常见统计应用错误的识别能力,提高对统计学 的正确利用率。方法:明确阐述各种常见医学实验设计类型的异同点和应用 场合,揭示常见统计应用错误的实质和危害性。结果:给出不适合用t 检验取代方差分析的充足理由和正确运用统计学的基本要领。结论:要提高实际 工作者的统计学应用水平,需要经常对其进行统计培训,积极引导他们与统计学工作者开展 科研协作。

    中图分类号: R311文献标识码:B 文章编号:1000-6834(2000)01-0087-05

, 百拇医药     THE DISCRIMINATIVE ANALYSIS OF THE COMMON DESIGN TYPES AND THE RATIONAL SELECTION OF THE STATISTICAL METHODS IN MEDICAL EXPERIMENTS

    HU Liang-ping

    (Department of Medical Statistics, Institute of Medical Information,Academy of Military Medical Sciences, Beijing 100850)

    ABSTRACT

    Aim: To improve the medical researchers' discriminative analysis of misu sed common statistics and the correct utilization ratio of statistics. M ethods: To expound clearly the similarities and differences and the appl icability of various common design types in medical experiments, and to reveal t he cause and harm of these common errors in statistical application. Res ults: To present the sufficient reasons for irreplacability of the analy sis of variance by t-test and main points concerning correct application of st atistics. Conclusion: Improvement of their utilization of statistics requires that medical researchers should receive constant training in statistic s and guidance in order to cooperate with statisticians in the scientific and re search work.
, 百拇医药
    KEY WORDS: design of a single factor with k levels; fa ctorial design; design with repeated measurements; t-test; analysis of var iance

    在医学实验研究中,为了考察多个处理因素的综合作用,同时为了有效地控制非处理因 素的干扰和影响,需要借助多因素实验设计方法。由于实验中所涉及的因素(包括处理因素 和重要的非处理因素,后者简称为区组因素)的个数和水平数不同、因素之间的组合方式不 同等原因,需要许多不同的实验设计类型与之相对应。不同的设计类型,所能回答的问题是 不同的,对收集资料的要求也不同。因而,对实验资料的表达、描述、统计分析,甚至对结 果的解释也是大有区别的。然而,从一些医学期刊的学术论文中却反映出一些令人担忧并带 有相当普遍性的问题:即一律用算术均数加减标准差的方式表达定量的观测结果,一律用t 检验处理观测结果为定量的实验数据,一律用χ2检验处理观测结果为定性的实验数据 [1,2]。
, 百拇医药
    应当清楚地意识到:用表达正态分布资料的方法表达明显呈偏态分布的资料,是对实验 资料真实性的一种严重歪曲;不探究实验资料所取自的实验设计类型,就用分析单因素二水 平设计资料的t检验进行处理,是对定量资料的肢解和破坏,是对因素之间客观存在的交互 作用的无视或回避;不顾定性变量的有序性,盲目套用与有序性毫无关系的χ2检验处理 单向有序和双向有序的列联表资料,是对定性资料的浪费和糟蹋。误用和滥用统计学,并非 仅仅是无关大局的一般性学术问题,而常常导致实验设计方面严重出错和对实验数据的错误 解释,从而得出令人怀疑、甚至是错误的结论。误用和滥用统计学,是降低医学科研工作科 学性的大敌,千万不可掉以轻心[3]

    1 常见医学实验设计类型的辨析方法

    1.1 常见医学实验设计类型简介[4]

    医学实验设计类型有几十种,其中常见的有:配对设计、成组设计、单因素K水平设计( K≥3)、配伍组设计、拉丁方设计、交叉设计、析因设计、正交设计和具有重复测量的设计 。从是否便于考察因素之间交互作用的角度看,前六种设计都不便考察交互作用,后三种设 计是可以考察交互作用的。从同时考察因素的个数多少角度看,前三种设计都属于单因素设 计,配伍组设计属于二因素设计,拉丁方设计、交叉设计都属于三因素设计,而后三种设计 即可以用于二因素设计,又可以用于多因素设计。由于配伍组设计、拉丁方设计和交叉设计 都不便考察交互作用,故最适合用于安排只含一个处理因素,含一个或二个区组因素的实验 研究场合。如果实验中同时涉及二个或二个以上处理因素,因素之间的交互作用往往又是不 可忽视的,此时,就应当选用析因设计或正交设计。如果希望观察接受不同处理的几组受试 对象某些定量观测指标随时间推移的动态变化趋势,需要在不同时间点上从同一个受试对象 身上进行多次观测,这就是所谓的重复测量设计。医学研究工作者常根据专业上的需要,自 发地运用了重复测量设计,但在收集资料时,无意识地将重复测自同一个受试对象的多个数 据与测自其他受试对象的数据混杂在一起,误将重复测量设计当作具有独立重复实验的析因 设计[2]。造成了在数据收集、统计分析方法选择和计算结果等方面出现了一系列 的错误。
, http://www.100md.com
    1.2 常见医学实验设计类型的辨析

    下面借助生理学、药理学等医学研究领域里的实例,介绍常见医学实验设计类型的辨析 方法。

    【例1】某人在研究三七皂甙Rg1对大鼠实验性血栓形成的影响和对正常血压及高血压大 鼠血小板内游离钙水平影响时,收集到表1和表2资料,均误用t检验作了统计分析。试判断 这二张表里的资料所对应的实验设计类型是什么。

    Tab.1 Effects of Rgl,Rb1 and lysinip irinum(LNP)on thrombosis in rats(±s) Drug/(mg*kg)

    Thrombosis wet weight/mg

    NS

    25.3±3.9
, 百拇医药
    Rg1 5

    8.7±1.2

    Rb1 5

    18.0±3.3

    LNP 9.04

    8.2±1.2

    NS:Normal saline;Rb1 and Rg1:Two components in Ginsenosides;LNP:LysinipirinumTab.2 Effects of Rg1 on platelet[Ca 2+] i under the influence of

    thrombin in normotensive and hypertensive rats(±s) Group
, 百拇医药
    Rg1/

    (μmol*L)

    [Ca2+]i*(nmol/L)

    Resting

    Thrombin

    Normotensive

    0

    167±24

    503±62

    1

    154±26

    255±66
, 百拇医药
    10

    141±30

    160±33

    100

    120±26

    140±31

    Hypertensive

    0

    230±47

    709±65

    1

    182±38

    312±46
, 百拇医药
    10

    140±39

    232±31

    100

    131±32

    157±37

    【分析与解答】表1中虽然涉及到药物和剂量二个方面,但一种药物只取了一种剂量,并不 能将剂量视为一个独立的因素。因此,在表1中,只有药物一个因素,它有四个水平,生理 盐水可被视为一种特殊的“药物”。显然,与表1资料所对应的实验设计类型应叫做单因素 四水平设计。

    表2资料中涉及到三个因素,即受试者的类型(分为正常血压者与高血压者)、接受药物R gl的剂量(分为0、1、10和100/μmol*L-1)和受试者被检测时所处的状态(静息与接受凝血酶刺激后)。本资料所对应的实验设计类型究竟是什么?这取决于在二种状态下是对各 组中每一只大鼠分别进行了检测,还是对不同大鼠进行了检测。若属于前一种情况,应叫做 具有一个重复测量的三因素设计;若属于后一种情况,应叫做三因素析因设计。
, http://www.100md.com
    【例2】某人在研究富硒螺旋藻(缩写成SES)对60 Co γ线胸部照射大鼠 诱发肺炎的防治作用时,收集到表3和表4资料。文中明确交代各组动物均在照后0.5、1、2 和3个月时活杀,检测有关指标的数值,但均误用t检验作了统计分析。试判断这二张表 里的资料所对应的实验设计类型是什么。Tab.3 Changes of BALFC(×106) measured in left lungs of

    rats at different time points by 60 Co γ irradiation of

    thorax in rats(±s),(n=6) Group

    BALFC(×106)

    Time(d):
, http://www.100md.com
    15

    30

    60

    90

    NC

    1.0±0.3

    2.4±0.5

    2.5±1.8

    2.4±1.2

    AI

    11.0±5.5

    15.8±9.1

    6.4±2.3
, 百拇医药
    7.0±5.6

    SI

    7.2±2.8

    6.2±1.2

    3.0±0.8

    2.7±1.0

    NC、AI and SI stand for normal group、merely irradiation group,and irradia tion plus selenium groupTab.4 Values of IOD measured from the c ollagen mRNA

    in rats’pulmonary tissue affected by SES(± s) Group
, http://www.100md.com
    α1(I)a

    α1(Ⅲ)b

    NC

    1.68±0.25

    1.38±0.15

    NI

    2.17±0.21

    1.73±0.08

    SI

    1.83±0.09

    1.40±0.11
, http://www.100md.com
    α1(I) and α1(Ⅲ) are two types of collagen,4.6 kb and 4.5 kb respecti vely; a and b are two time points,0.5 and 2 in month after irradiation respectiv ely,when the values were measured

    【分析与解答】在表3资料中,虽然有不同的四个时间点,但对每一只大鼠来说,仅在一个 时间点上被观测,故此实验设计不属于重复测量设计。表3中涉及处理和时间二个因素,二 因素之间的12种水平搭配下都独立地做了6次重复实验,故与该资料对应的实验设计类型应 叫做二因素析因设计。

    在表4中,从实验设计的严谨性角度看,存在一点问题。因为表中实际涉及了三个因素 ,即处理、胶原类型和照射时间,但胶原类型与照射时间的效应之间产生了混杂。因为照后 0.5月的大鼠用的是第一种胶原,而照后2月的大鼠用的是第二种胶原,若二者之间的差别 有显著性意义,不知是因胶原的类型不同所致,还是照后时间不同所致。于是,表4中纵向 二个条件只能被视为一个混杂因素的二个水平。在这种假定之下,与表4资料对应的实验设 计类型也应叫做二因素析因设计。
, 百拇医药
    【例3】某人用6.5 Gy照射小鼠后再用几种不同的药物治疗,观察每只小鼠照后不同时间点 上外周血白细胞数的动态变化情况,各处理组中的小鼠在不同时间点上反复被观测。资料如 表5所示。原作者误用t检验分析了该资料,问与此资料所对应的实验设计类型应当是什么?

    Tab.5 Changes of circulating WBC(×109/L) in rats by 6.5γ ir radiation(±s,n=10) Days after irrad#

    Group

    WBC(×109/L)

    Control

    rhIL-6

, 百拇医药     rhG-CSF

    rhIL-6+rhG-CSF

    Before*

    19.7±1.8

    17.3±3.2

    17.9±3.8

    18.3±3.7

    7

    1.8±0.7

    1.9±0.8

    2.0±1.0

    2.2±1 .5
, 百拇医药
    10

    1.8±0.9

    1.7±0.8

    1.7±0.6

    1.3±0.6

    14

    1.9±0.6

    2.9±1.0

    2.7±1.1

    2.5±0.9

    17

    2.8±1.0

, http://www.100md.com     3.3±0.9

    4.6±1.2

    4.5±1.1

    21

    7.6±2.0

    6.6±2.4

    6.0±3.0

    6.9±4.2

    23

    9.4±3.8

    9.7±4.2

    9.7±3.9

, 百拇医药     8.7±5.6

    irrad# means irradiation;before* means before irradiation.rhIL-6,200uKD;rh G-CSF,125 uKD

    【分析与解答】在表5中,究竟涉及了几个处理因素?很多人都认为它涉及了二个因素,一个 是药物种类,另一个是照后时间。其实,它涉及了三个处理因素,除照后时间外,纵向所列 的四组是各有二水平的二个因素的四种组合,并非是一个药物因素的四个水平,仔细观察不 难看出,这个组合因素的四个水平就是由rhIL-6不用与用、rhG-CSF不用与用的四种组 合。将这四种组合视为四个实验条件,每个实验条件下的10只小鼠在7个不同的时间点上被 重复观测WBC的值,故与表5对应的实验设计类型应叫做具有一个重复测量的三因素设计。若 将表5资料用表6的形式表达,则容易辨别出它所从属的设计类型。

, 百拇医药     除了上述已经接触到的重复测量设计形式外,根据整个实验所涉及的因素的多少以及在 重复测量方向上所涉及到的因素数目还有具有二个重复测量的二因素设计和具有二个重复 测量的三因素、四因素设计等,其设计和统计分析方法参见有关文献[4]。Tab.6 Changes of circulating WBC(×109/L) in rats at differe nt time points by 6.5γ irradiation(±s,n=10) Days after irrad#

    TREATMENT:

    WBC(×109/L)

    A0,B0

    A1,B0
, 百拇医药
    A0,B1

    A1,B1

    Before*

    19.7±1.8

    17.3±3.2

    17.9±3.8

    18.3±3.7

    7

    1.8±0.7

    1.9±0.8

    2.0±1.0
, 百拇医药
    2.2±1. 5

    10

    1.8±0.9

    1.7±0.8

    1.7±0.6

    1.3±0.6

    14

    1.9±0.6

    2.9±1.0

    2.7±1.1

    2.5±0.9

    17

, 百拇医药     2.8±1.0

    3.3±0.9

    4.6±1.2

    4.5±1.1

    21

    7.6±2.0

    6.6±2.4

    6.0±3.0

    6.9±4.2

    23

    9.4±3.8

    9.7±4.2

, 百拇医药     9.7±3.9

    8.7±5.6

    Irrad# means irradiation;Before* means before irradiation.A0and A1stan d for not using and using rhIL-6;B0and B1stand for not using and using rh G-CSF

    2 常见医学实验设计类型资料的统计分析方法

    2. 1 为什么不能用t检验取代方差分析

    t检验每次只能比较二个平均数,因此,它仅适用于单因素一、二水平的实验设计类型 。当设计类型为单因素多水平或多因素设计时,若仍用t检验分析资料,是不妥当的。 其理由有以下五点:其一,对原始资料的利用率很低,每次只能用到全部实验数据的几分之 一;其二,破坏了原先的整体设计,将本属于多因素析因设计或重复测量设计割裂成多个单 因素二水平的设计;其三,犯假阳性错误的概率大大增加,因为 t检验只能将每次比较 时犯假阳性错误的概率控制在规定的显著性水平上(即事先给定的α值),而多次t检验 之后犯假阳性错误的总概率将随着比较的次数n的增大而趋向于1;其四,当实验中同时 涉及二个或二个以上处理因素时,因素之间往往存在不可忽视的交互作用,而t检验割 裂了因素之间的内在联系,无法考察交互作用是否具有显著性意义;其五,由于不同组均数 之间比较的t检验所用的标准误(即公式的分母)在不断改变,t统计量的自由度小(因为 资料的利用率低),所以,多次运用t检验的过程中,评价标准不统一。综上所述,充分说 明用t检验处理非单因素一、二水平的设计资料所得结论的可靠性差[2]
, 百拇医药
    应当明确的是:特定的实验设计类型,有相应的方差分析方法。方差分析之后,若某因 素或交互作用具有显著性意义,又有相应的两两比较方法。这些方法可以克服t检验的上述不足。

    2.2 方差分析的前提条件

    不同的设计类型,需要运用相应的方差分析方法。但严格地说,方差分析也有其应用条 件。与t检验相同,它也要求资料满足正态性(即各组数据分别服从正态分布)和方差齐 性(即任何一个因素的多个水平所对应的多个总体方差应相等)。如果应用条件不满足,要么 找到合适的变量变换方法,使变换后的数据满足条件,再对变换后数据进行方差分析;要么 找到相应的非参数检验方法。

    2.3 常见方差分析的种类及其合理选用要领

    概括地说,方差分析方法有几十种。因为存在几十种不同的实验设计类型,而每一种实 验设计类型,有与其对应的方差分析方法。分析的思路是基本相同的,只是具体的计算公式 (即统计模型)是有区别的。
, 百拇医药
    对于表1资料,如果四组资料都分别满足正态性,四组资料满足方差齐性,则应选用单 因素四水平设计资料的方差分析。若方差分析的结果为四组均数之间的差别有显著或非常显 著性意义(P<0.05或P<0.01),尚需作多个均数之间的两两比较。若四组中任何两 组之间都需要比较,有多种方法,其中较常用的方法叫q检验;若三个药物组之间不需 比较,而三个药物组都需与生理盐水组比较,则应选用 DUNNETT的 t检验。后者与通常的 t检验(称为STUDENT’s t-test)是有很大区别的,欲知详情,请看有关文献[4,5]

    对于表2资料,如果原始资料满足正态性和方差齐性,根据它是属于三因素析因设计还是属 于具有一个重复测量的三因素设计,就应分别选用相应设计资料的方差分析方法。通过三因 素析因设计资料的方差分析,可以分析出三个因素各自的效应大小以及它们之间各级交互作 用(包括任何二个因素之间和三个因素之间的交互作用)的效应大小。当交互作用具有显著性 意义时,还可对其作进一步分解,以便发现因素之间的最佳水平组合。通过具有一个重复测 量的三因素设计的方差分析,可以有效地排除个体差异和相邻时间点上观测值之间的高度相 关性对结果的干扰和影响,比运用一般的方差分析方法能更合理、更有效地揭示因素及其交 互作用的效应大小。
, 百拇医药
    若资料满足正态性和方差齐性,对于表3和表4资料,应选用二因素析因设计资料的方差 分析予以处理。对于表6资料,则需要运用具有一个重复测量的三因素设计资料的方差分析 。

    3 讨论与建议

    因素的数目、因素之间的组合方式以及实验的具体实施方式等是判断实验设计类型的重 要参考依据。当实验中涉及时间因素时,要特别注意区分何时属于重复测量,何时属于独立 重复实验。一旦将二者混淆,就会导致误用统计模型,极易得出错误结论的后果。当实验中 涉及到多个处理因素的水平组合时,人们常习惯将全部组合冠以“组别”字样(如表5中的“ 组别”),并把“组别”视为一个处理因素,进而,又把这个所谓的具有多个水平的处理因 素拆成多个单因素二水平的设计,反复运用t检验进行分析。这是分析定量资料中最常 见的一种错误,应当引起人们的足够重视。

    对于重复测量设计,要事先编制好收集实验数据的表格,确保重复测自同一个受试者的 K个 数据写在同一行上,以便从总离均差平方和中分解出个体差异的影响,也有利于消除时间点 之间相关性不等的影响[2]
, http://www.100md.com
    在医学科研中,要解决的问题往往比较复杂,经常要运用多因素实验设计方法和相应的 统计分析方法。这些方法掌握起来并非轻而易举,而实际工作者往往没有足够的时间通晓全 部统计学知识。为了在医学科研工作和学术刊物中避免出现严重的统计学方面的错误,笔者 建议应在下列三方面多作一些工作:其一,业务主管部门和学术期刊出版部门要首先提高对 统计学作用的正确认识,采取切实可行的措施阻止有严重统计学问题的成果通过鉴定和论文 公开发表;其二,有关领导和业务部门要努力创造条件,使实际工作者经常有机会接受统计 学知识的培训,提高他们应用统计学的水平和能力;其三,应大力倡导科研协作精神,做到 人尽其才,物尽其用。实际工作者与统计工作者的密切合作,不仅可以达到事半功倍的效果 ,还可大大提高科研工作的科学性和严谨性。

    利用国际上著名的统计分析系统(简称 SAS)[5],可以有效地进行多因素实验 设计和各种实验资料的统计分析,它可以帮助人们从依赖计算器和t检验的落后局面中 解放出来。随着人类文明程度的不断提高,科研工作(包括医学期刊中论文的质量)的水平和 质量也应不断提高,以适应时代的发展。
, 百拇医药
    作者简介:胡良平(1955-),男,安徽人,副教授,硕士,从事医 学实验设计、多元统计分析与SAS软件应用的开发研究

    参考文献

    [1] 胡良平,刘惠刚.医学期刊中常见统计错误分析.中华医学写作杂志[J], 1998;5(2):28.

    [2] 胡良平主编.医学统计应用错误的诊断与释疑[M].北京:军事医学科学出版社, 1999:1-105.

    [3] 胡良平.医学科研与新药评价等工作中一个不可忽视的问题——轻视和误用统计学 [J].军事医学科学院院刊,1996;20(3):202

    [4] 胡良平主编.现代统计学与SAS应用[M].北京:军事医学科学出版社,1996:57- 151.

    [5] SAS Institute Inc. SAS/STAT User's Guide, Release 6. 03 Edition. Nort h Carolina, USA: SAS Institute Inc. 1988:549-637, 941-947.

    收稿时间:1999年7月19日;修回时间:1999年10月8日, http://www.100md.com