当前位置: 首页 > 期刊 > 《数理医药学杂志》 > 1999年第2期
编号:10261271
Meta分析中两水平混合效应模型方法的探讨
http://www.100md.com 《数理医药学杂志》 1999年第2期
     作者:李晓松 刘巧兰 倪宗瓒

    单位:华西医科大学卫生统计学教研室 成都610041

    关键词:Meta分析;效应尺度;两水平混合效应模型

    数理医药学杂志990201

    摘要 通过对Meta分析中“效应尺度”的选择以及两水平混合效应模型建模方法的探讨,表明正确拟合两水平混合效应模型既可获得总平均“效应尺度”及其可信区间的估计,亦可探讨“效应尺度”的影响因素,即获得具有不同研究特征的平均“效应尺度”及其可信区间的估计。

    Meta分析是汇总众多研究结果的一种定量分析方法,主要目的是为了得到比单一研究更精确的结果估计,以及分析影响研究结果间差异的因素。目前,Meta分析主要根据研究的“效应尺度”(effect magnitude)的齐性检验结果,决定采用固定效应或随机效应模型合并每项研究的“效应尺度”,但一般未考虑到研究具有不同的特征以及相应的平均“效应尺度”的差异[2]。多水平模型是国外教育学界80年代中后期发展起来的一门多元统计分析新技术,是当前国际上统计学研究中一个新兴而重要的领域[1]。本文拟通过对“效应尺度”的选择以及具有协变量的两水平混合效应模型建模方法的探讨,估计总平均“效应尺度”以及具有不同研究特征的平均“效应尺度”及其可信区间。
, http://www.100md.com
    1 资料与方法

    本文拟对国内外有关研究吸烟与肺癌关系的49篇文献进行再分析,数据包括每项研究的吸烟与肺癌联系的危险度指标OR值或ln(OR)值及其标准误,以及样本含量等。

    Meta分析的数据具有两个水平的层次结构(two-level hierarchy),水平2为研究水平,水平1为个体水平。对于具有这种特征的数据,两个水平模型可将传统模型中单一的随机误差项分解到与数据层次结构相对应的水平上,即分解出研究水平的变异。模型基本结构为:

    Yij0+u0j+eij

    j=1,2,…,m,代表研究项目数;i=1,2,…,n,代表研究个体数;Yij为各项研究的“效应尺度”;β0为总平均“效应尺度”的估计;u0j和eij分别为研究水平和个体水平残差。
, 百拇医药
    Meta分析一般只能得到各项研究的结果即“效应尺度”及其标准误以及样本含量等数据,研究个体的数据一般是不可得的,因此,这里拟合的两水平模型为聚集水平(水平2)模型,可表达为:

    Y*j0+u.j+e*j

    Var(u.j)=σ2u

    Var(e.j)=σ2e/nj

    总方差为σ2u2e/nj,可通过对随机部分定义一个设计变量来拟合模型,即z.j=1/nj,相应的随机系数为e.j,nj为每项研究中的研究个体数。
, 百拇医药
    本文首先拟合的无任何解释变量的“无效模型”(null model)为:

    Y.j0+u.j+e.jz.j

    在收集到的文献中,多数研究的“效应尺度”为OR值,有的为ln(OR)值,即通过logistic回归模型获得的β值,两者可相互转换。分别将OR值和ln(OR)值作为反应变量拟合两个“无效模型”,因此,式中Y.j分别表示两个模型中第j项研究的ORj值和ln(ORj)值,β0分别表示合并全部ORj和ln(ORj)的平均估计值,u.j为第j项研究的随机效应,e.j为与第j项研究有关的随机误差,结果见表1。

, 百拇医药     然后ln(OR)为反应变量,在模型中引入研究水平协变量国别x.j(国内研究取0,国外研究取1),将其效应β1拟合为固定效应,用一个随机成份拟合剩余的部分,结果见表2。混合效应模型为:

    Y.j01x.j+u.j+e.jz.j

    另一种建模方式,即不拟合截距项,将国别转换为x1.j和x2.j两个哑变量引入模型,它们分别对应于国内与国外研究,仍将其效应β1和β2拟合为固定效应,同时用一个共同的随机成份u.j拟合剩余部分,结果见表3与表4。模型可表达为:

    Y.j1x1.j2x2.j+u.j+e.jz.j
, http://www.100md.com
    2 结果

    表1 分别以OR和ln(OR)为“效应尺度”的拟合结果

    以OR为“效应尺度”

    以ln(OR)为“效应尺度”

    估计值

    标准误

    估计值

    标准误

    固定参数β0

    5.1640

    0.6086

    1.4060
, 百拇医药
    0.1050

    随机参数

    研究水平σ2u

    个体水平σ2e

    17.7900

    1

    3.63200

    0

    0.5392

    1

    0.1094

    0
, http://www.100md.com
    以OR为“效应尺度”,模型所估计的总平均“效应尺度”为5.1640,95%可信区间为3.9711~6.3569;以ln(OR)为“效应尺度”,根据ln(O)±uαSln(OR),可计算总平均“效应尺度”OR的估计为eβ0=4.0796,95%可信区间为4.0796×e±1.96×0.1050,即3.3208~5.0118。可见,总平均“效应尺度”下降了1.0844,可信区间亦变窄。此外,研究水平的方差估计从17.7900下降到0.5392,估计精度亦增加,标准误从3.6320下降到0.1094。表2 引入研究水平协变量的拟合结果

    估计值

    标准误

    固定参数

    β0
, 百拇医药
    β1

    1.0370

    0.6238

    0.1496

    0.1943

    随机参数

    σ2u(研究水平)

    σ2u(个体水平)

    0.4453

    1

    0.0904
, http://www.100md.com
    0

    结果表明,“效应尺度”与国别有关,其参数估计为正,表明国外研究的OR值较大,经转换得国内研究的OR估计为e1.0370=2.8207,国外研究的OR值计为e1.6608=5.2635,相差甚大。研究间方差及其标准误估计分别从0.5392和0.1094下降为0.4453和0.0904,亦表明国别这一研究水平协变量解释了部分研究结果间变异。但从参数估计难以计算国外平均“效应尺度”的可信区间。表3 引入研究水平协变量的拟合结果(不拟合截距项)

    估计值

    标准误

    固定参数

    β0

    β1
, 百拇医药
    1.0370

    1.6600

    0.1496

    0.1241

    随机参数

    σ2u(水平2)

    σ2u(水平1)

    0.4453

    1

    0.0904

    0

    根据,可直接得到国内与国外研究的平均“效应尺度”及其可信区间,见表4。表4 根据表3的转换结果
, http://www.100md.com
    研究数目

    OR

    95%可信区间

    国内研究

    20

    2.8207

    2.1039~3.7818

    国外研究

    29

    5.2593

    4.1237~6.7076

    与表2转换结果比较,国内、外研究的OR估计基本一致,研究间方差及其标准误估计完全一致,但拟合国内外两个哑变量的固定效应,可直接得到其标准误的估计,国外略小。3 讨论
, 百拇医药
    3.1 在流行病学横断面调查和病例对照研究中,常采用比值比OR反映暴露与疾病的联系强度,即患者暴露比与非患者暴露比的比值,但其常不服从正态分布,而其对数转换值ln(OR)近似服从正态分布。多水平模型的基本假定是反应变量遵从正态分布,水平2和水平1残差遵从N(0,σ2u)和N(0,σ2e/nj)[1],故在两水平混合效应模型中应以ln(OR)为分析的“效应尺度”,然后再将分析结果转换为OR值,否则平均“效应尺度”及其可信区间均不可靠。本文分析结果表明,以ln(OR)和OR为反应变量所估计的平均“效应尺度”相差1.0844,可信区间亦相差较大。另一方面,Meta分析中研究水平的协变量一般均为分类变量(如分为m类),若直接或转换为(m-1)个哑变量引入模型,以一个共同的基础类(截距)为比较的标准,则难以得到每类的可信区间估计。但若将分类变量转换为m个哑变量,即每个哑变量分别指示每种取值,模型中不拟合截距项,则可获得每类如本文国内与国外研究的平均“效应尺度”及其可信区间的估计,这一方法相当于通过原点的回归[1]
, 百拇医药
    3.2 通过采用的固定效应或随机效应模型可得到平均“效应尺度”及其可信区间的估计,但这些模型一般不能分析影响研究结果间差异的因素[2]。两水平混合效应模型将研究水平协变量拟合为固定效应,用以解释研究结果间的差别,以一个随机成份拟合其剩余部分,从而正确评价研究水平的因素对研究结果的影响。在Meta分析中,各面研究结果常具有很大的不同一性,如本文国内外研究结果的估计分别为2.8207和5.2593,相差达2.4386,如不考虑研究水平协变量的影响而直接合并的结果为4.0796,可见,固定或随机效应模型的合并是不适宜的。“无效模型”中研究水平的方差估计σ2u为0.5392,亦提示研究结果之间存在较大的不同一性。混合效应模型表明,国别这一研究水平协变量解释了部分研究结果间的变异,研究水平方差下降为0.4453,但仍遗留了较大的变异,提示尚存在其它因素导致研究结果间的差异,如果可得到这些研究水平的因素,则可通过两水平混合效应模型进一步评价其对研究结果的影响。

    参考文献

    1 Goldstein,H.Multilevel Statistical Models. London:Edward Amold.1995.

    2 Hedges, LV. et al. Statistical Methods for Meta-Analysis. Orlando, Florida: Academic Press.1985.

    收稿日期:1999-01-25, 百拇医药