当前位置: 首页 > 期刊 > 《第四军医大学学报》 > 2004年第23期
编号:10925320
医学多变量重复观测资料的随机系数模型
http://www.100md.com 《第四军医大学学报》 2004年第23期
     Multivariate random coefficients model of repeated measures data in medical research

    CHEN ChangSheng, XU YongYong, YUAN TianFeng, ZHAO DongTao, SHANG Lei, XIA JieLai1, PAN Feng

    1Department of Health Statistics, School of Preventive Medicine, 2Editorial Department of Journal, 3Department of Mathematics, School of Biomedical Engineering, Fourth Military Medical University, Xi’an 710033, China

    【Abstract】 AIM: To study multivariate random coefficients model of repeated measures data in medical research. METHODS: Both diastolic and systolic blood pressures repeated measures data, collected from 120 drug abusers after taking two kinds of medicine (Drug A: Xiaoyinfuzheng, Drug B: Kelening), were analyzed by multivariate random coefficients model. The fixed effect parameters matrix x of model coefficients were estimated by using least squares estimation method, the effects between treatment groups were compared and the variancecovariance matrices of random effect were also estimated. Related analysis methods were programmed with SAS/IML code. RESULTS: Estimated parameters with fixed effect and random effect were obtained and graphs were drawn. Both diastolic and systolic blood pressures changed with time after treatment and the trends between treatment groups were different. A slow change was observed in Drug A group, while a greater curvature was found in Drug B group. Both diastolic and systolic blood pressures in Drug A group were higher than those in Drug B group. CONCLUSION: Multivariate random coefficients model can effectively analyze the dynamic change trend and random effects of multivariate repeated measures data in medical research.

    【Keywords】 repeated measures; random coefficients model; multivariate statistics

    【摘要】 目的:研究医学重复观测数据的多变量随机系数模型. 方法:对两种药物(A药:消瘾扶正胶囊,B药:可乐宁)治疗120例患者后的舒张压和收缩压重复观测数据进行多变量随机系数模型分析,对模型系数的固定效应参数矩阵ξ作最小二乘估计并进行组间比较,同时估计随机效应的方差协方差矩阵,分析方法用SAS/IML软件编程得以实现. 结果:得到了固定效应和随机效应有关参数的估计值,并给出了曲线图. 用药后患者的舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,A药组的变化相对平缓,而B药组起伏波动较大,用药后A药组的舒张压和收缩压相对来说均较B药组为高. 结论:多变量随机系数模型可有效地进行多变量重复观测数据的动态变化趋势分析以及随机效应分析.

    【关键词】 重复观测;随机系数模型;多元统计学

    0引言

    医学研究中常会遇到重复观测数据的统计分析问题,例如,在临床上,为了研究不同降压药的疗效而对高血压患者服药前、服药后2, 4, 6和8 wk的血压进行重复观测;在儿少卫生中,为了研究儿童体格发育情况,定期重复观察不同喂养方式的婴儿体格发育指标,如身长、坐高、体质量等. 这类研究对个体的观察指标进行多次反复测量,其观测结果体现的是整个重复观测场合中个体指标发展变化趋势以及相关因素的影响. 由于重复观测数据间存在自相关性且随机误差至少可分为两个层次,即个体间误差和个体内反复测量间误差,因而其分析方法有别于一般的统计分析方法[1-3]. 另外,在实际工作中为了了解多个变量间的关系以及变化规律,常常需要在不同的时间点同时观测个体的多个反应变量,如收缩压和舒张压,身高和体质量等,此时,需要进行多变量分析. 为了充分利用该类数据所包含的信息以及更好地动态了解个体多个反应变量的变化规律,我们用SAS/IML软件编写了分析程序[4,5],并对医学多变量重复观测数据进行了随机系数模型分析.

     1资料和方法

    1.1资料

    取自西安市药物依赖治疗中心提供的数据,治疗中心为了比较消瘾扶正胶囊和可乐宁两种药物的治疗效果,将120名药物依赖患者随机分为两组,A组用消瘾扶正胶囊治疗,B组用可乐宁治疗,对其舒张压和收缩压进行测量,用药后5 d内的观测结果见Tab 1.表1治疗后患者的舒张压和收缩压(略)

    1.2方法

    假设在重复观测设计研究中,有r个处理组,第j组(j=1,2,…,r)的观察个体数为nj,N=n1+n2+…+nr,对每一个体的m个反应变量(指标)重复观测p次,相应的观察点(如时间)为t1, t2, …,tp,Yik表示在观察点ti处第k个个体的m个变量的观察值向量(i=1,2,…, p; k=1,2,…, N),Yk表示第k个个体的pm维列向量,即由p个向量Yik(i=1,…, p)依次“拉直”而成,则有多变量随机系数模型[6]

    Yk=(BIm)βk+εk(1)其中εk为随机误差向量,服从多元正态分布Npm(0,IpΣe),Σe为m阶方阵,βk为第k个个体的mq维模型系数向量,B为p×q阶ti的幂阵,称为轮廓设计阵,即B=t01〖〗t11〖〗…〖〗tq-11t02〖〗t12〖〗…〖〗tq-12…〖〗…〖〗…〖〗…t0p〖〗t1p〖〗…〖〗tq-1p式(1)中的符号“AB”表示矩阵A与矩阵B的Kronecker积,即A=(aij), B=(bij), AB=(aijB).

    随机系数模型中的βk是与观察个体有关的向量,随个体而变化,由固定效应和随机效应两部分组成,即βk=ξak+λk,固定效应部分中的ξ为未知的mq×r阶模型参数矩阵,ξ的第j列对应第j组,并且前m个元素为m个变量t0的系数(即截距),接着的m个元素为t1的系数,如此反复直到tq1的m个系数. 固定效应部分中的ak为已知的r×1阶矩阵,随机效应部分中的λk为个体随机效应向量,服从多元正态分布Nmq(0,Σλ), λk与εk相互独立. 因此,可得到以下模型Yk=(BIm)ξak+(BIm)λk+εk(2)

    其中Var(Yk)=Σ=(IpΣe)+(BIm)Σλ(B′Im). 未知参数ξ的最小二乘估计值为ξ^=[(B′B)-1B′Im]YA′(AA′)-1(3)其中Y=[Y1,…,YN],A为分块对角阵,称为处理设计阵,即A=diag[E1n1,E1n2,…,E1nr], Eab表示元素全为1的a×b阶矩阵. ξ^的协方差阵为Var(ξ^)=(AA′)-1[(B′B)-1Σe+Σλ](4)Σe和Σλ的估计值分别为Σ^e=Se〖〗N(p-q)(5)Σ^λ=Sλ〖〗N-r-(B′B)-1Σ^e其中Sλ=[(B′B)-1B′Im]{Y[I-A′(AA′)-1A]Y1}[B(B′B)-1Im],Se=ΣN〖〗k=1yk[I-B(B′B)-1B′]y′k,yk=[Y1k,Y2k,…,Ypk].

    如果对个体模型系数βk感兴趣,则可得到βk的估计值为β^k=[(B′B)-1B′Im]Yk-V^(V^+Σ^λ)-1{[(B′B)-1B′Im]Yk-ξ^ak}(6)其中V^=(B′B)-1Σ^e,β^k的协方差阵Var(β^k)的估计值为V^-V^(V^+Σ^λ)-1V^.

     2结果

    2.1模型参数ξ的估计值在多变量随机系数模型(1)中,m=2,p=5,由文献[7,8]可知q=4,则轮廓设计阵B为B=1〖〗1〖〗1〖〗11〖〗2〖〗4〖〗81〖〗3〖〗9〖〗271〖〗4〖〗16〖〗641〖〗5〖〗25〖〗125

    已知处理设计阵A=diag(E1,60, E1,60),则q=4时的多变量随机系数模型ξ的最小二乘估计见Tab 2.表2多变量随机系数模型ξ的估计值(略)

    2.2Σe和Σλ的估计值Σe和Σλ的估计值分别为Σ^e=0.2160〖〗0.0784〖〗0.3199和Σ^λ=18.8815〖〗-3.3069〖〗-17.5969〖〗3.1433〖〗5.0225〖〗-1.0620〖〗-0.4470〖〗0.1239〖〗3.8007〖〗3.9256〖〗-3.0348〖〗-1.3101〖〗0.8042〖〗0.1327〖〗-0.0657〖3〗16.4527〖〗-3.6576〖〗-4.6442〖〗1.2432〖〗0.4065〖〗-0.1460〖4〗2.3011〖〗1.2412〖〗-0.5232〖〗-0.1288〖〗0.0304

    〖5〗1.2928〖〗-0.4229〖〗-0.1110〖〗0.0498〖6〗0.0894〖〗0.0443〖〗-0.0005

    〖7〗0.0093〖〗-0.0052〖8〗-0.0009为了节省篇幅,这里不再列出β^k和Var(β^k)的估计结果.

    2.3随机系数模型曲线图见Fig 1,2.

     3讨论

    随机系数模型假定模型系数向量βk是与观察个体有关的向量,随观测个体而变化,由固定效应和随机效应两部分组成,即βk=ξak+λk,固定效应部分的模型参数矩阵ξ的分量受不同的实验设计条件或其他有关的协变量(如性别、起始年龄、社会经济地位等)的影响,但与重复观察因素(如时间)无关.

    由Fig 1,2可见两组随机系数模型曲线不同,即两组模型参数向量ξ不等. 由以上随机系数模型分析得到的βk可知,不同观察个体的曲线不同,随机系数模型不仅可得到个体和总体平均曲线参数信息,而且可分析重复观测资料的个体差异以及重复测量误差,即可估计两层随机误差的协方差阵Σe和Σλ. 以上分析表明用药后患者的平均舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,消瘾扶正胶囊组的舒张压和收缩压变化相对平缓,而可乐宁组的舒张压和收缩压起伏波动较大,且在用药后第2日达到最低点,随后舒张压和收缩压缓慢回升. 两种药物均有降低舒张压和收缩压的效果,且在用药后第1日时已明显降低(用药前药物依赖患者平均舒张压和收缩压分别为9.11 kPa和13.89 kPa),用药后消瘾扶正胶囊组的舒张压和收缩压相对来说均较可乐宁组为高,可认为两种药物在降低血压方面存在不同的影响.

    【参考文献】

    [1] Vonesh EF, Chinchilli VM. Linear and nonlinear models for the analysis of repeated measurements[M]. New York: Marcel Dekker, Inc., 1997:32-102.

    [2] 陈长生, 徐勇勇, 曹秀堂. 不等距重复观测数据组间比较的正交回归模型[J]. 中国卫生统计, 1996; 13(3): 1-5.

    Chen CS, Xu YY, Cao XT. Orthogonal regression models for comparison of unequallyspaced repeated measures data across groups[J]. Chin J Health Stat, 1996; 13(3): 1-5.

    [3] 陈长生, 徐勇勇, 赵东涛. 医学重复观测数据裂区方差分析的假定条件的检验[J]. 第四军医大学学报, 2001; 22(7): 642-644.

    Chen CS, Xu YY, Zhao DT. The test for the presuppositions concerning the validity of split

    plot analysis of variance with repeated measures in medical researches[J]. J Fourth Mil Med Univ, 2001; 22(7): 642-644.

    [4] SAS Institute Inc. SAS/IML Software[M]. Version 6. 2nd ed. Cary: SAS Institute Inc., 1993: 1-382.

    [5] SAS Institute Inc. SAS/STAT Software: Changes and enhancements through Release 6.11[M]. Cary: SAS Institute Inc., 1996: 1-267.

    [6] Kshirsagar AM, Smith WB. Growth curves[M]. New York: Marcel Dekker, Inc., 1995: 32-115.

    [7] 陈长生, 徐勇勇, 张音, 等. 医学重复观测数据组间比较的生长曲线模型[J]. 中华预防医学杂志, 1998; 32(4): 245-247.

    Chen CS, Xu YY, Zhang Y, et al. Growth curve model for comparison of repeated measures data across medical treatment groups[J]. Chin J Prev Med, 1998; 32(4): 245-247.

    [8] 陈长生,徐勇勇,夏结来. 医学多变量追踪数据的生长曲线模型[J]. 中国卫生统计, 2000; 17(4): 194-196.

    Chen CS, Xu YY, Xia JL. Multivariate growth curve model of longitudinal data in medical research[J]. Chin J Health Stat, 2000; 17(4): 194-196.

    基金项目:国家自然科学基金(39900126);陕西省自然科学基金(2003F11)

    通讯作者:陈长生(1966),男(汉族),江西省高安市人. 博士,副教授. Tel.(029)83374853Email.ccscbr@sina.com

    (第四军医大学:1预防医学系卫生统计学教研室,2学报编辑部,3生物医学工程系数学教研室,陕西 西安 710033)

    编辑王雪萍, http://www.100md.com(陈长生,徐勇勇,袁天峰,赵东涛,尚磊,夏结来,潘峰)