当前位置: 首页 > 期刊 > 《北京中医药大学学报》 > 1999年第2期
编号:10252235
中医临床常用统计方法
http://www.100md.com 《北京中医药大学学报》 1999年第2期
     作者:王泓午

    单位:北京中医药大学 北京100029

    关键词:中医临床;数据资料;统计方法;单变量统计分析

    北京中医药大学学报990205 临床医生认识疾病多靠患者形象直观的症状及理化检查结果来获得。以这些病例为原始资料,经过统计学处理,从而得出临床实践观察测量所有偶然性的数据,并进一步推论出有规律性结论,从而使中医临床医学达到“信息反馈→实践→再提高”这一良性循环。在数据资料处理过程中必然会用到统计学知识。统计学是运用概率论和数理统计的原理、方法研究数字资料的搜集、整理、分析和推断,从而掌握事物内在客观规律的一门学科。概率论和数理统计是它的基础,其应用于医学中,就形成了医学统计学。实现统计方法全过程分三部分:一是掌握统计学的概念和方法,以便根据具体情况正确选用统计方法;二是正确运用统计方法处理实际资料;三是把专业与统计知识紧密结合起来,对计算结果给出合理的解释,从而得出科学结论。现在,随着计算机技术的飞速发展,统计计算多通过统计软件在计算机上完成,故临床资料数据处理全过程中,正确应用医学统计方法是关键。本文主要介绍中医临床资料数据处理常用到的单变量统计分析(UnivariateAnalysis)。
, 百拇医药
    1 临床资料数据处理的几个基本概念

    1.1 总体与样本(Population and Sample)

    总体是根据研究目的确定的同质事物中所有观察单位的全体。临床研究的对象是病人,如研究某两种中药对真中风病患者的急性期治疗效果,总体就是全部真中风病患者。当然我们在临床上无法研究全部的真中风病患者,既总体。而是用随机化的方法抽取其中一部分病例进行研究,这一部分病例称样本。样本的研究目的是了解总体,推论总体规律。要保证样本的可靠性,必须要求当总体确定后,样本中每一观察单位确属预先确定的同质总体。另外,还要保证样本具有代表性,能够充分反映总体的真实情况,还必须要求抽样遵守随机化原则,并有足够的样本含量。

    1.2 抽样误差(Sample error)

    在抽样过程中,即使是从同一总体中随机抽取含量相等的若干样本,算得的样本指标也不一定相等,这种因抽样产生的样本与样本之间,样本与总体之间相应统计指标之间的差异,称抽样误差。由于个体差异,样本未包含总体的全部信息,即使以随机化原则抽样,样本与总体之间差异仍不可避免,因而抽样误差是无法避免的。临床研究不可能观察过多病例,而抽样误差的大小取决于观察个体间变异程度大小和样本含量多少,变异程度越小,样本含量越多,抽样误差越小,反之亦然。
, 百拇医药
    1.3 概率(Probability)

    概率是度量某随机事件发生可能性大小的一个数量,常用符号P表示,临床观察结果有两种类型,一是必然事件,二是随机事件,在一定条件下必然发生的事件称必然事件,而可能发生也可能不发生的事件称随机事件,医学上许多事件是随机事件,如病人来医院就诊,其临床治疗效果的有效与无效、治愈与死亡,在治疗前是不能轻易作出肯定答复的,因此病人治疗效果是随机事件。

    概率的取值范围在0~1之间,可用小数或百分数表示,即0≤P≤1,或0%≤P≤100%,某一事件必然不发生,则该事件发生的概率为0;某一事件必然发生,则该事件发生的概率为1。当P→0时,表示某一事件发生的可能性极小,小的几乎不可能发生。当P→1时,表示某事件发生的可能性极大,大得几乎必然要发生。临床上最常见的为P>0.05,P≤0.05,P≤0.01,如果出现P<0.05是说该事件出现的概率小于5%,当样本足够大时n≥30或n≥100例时,频率具有稳定性的随机事件,可将频率作为概率的估计值。
, http://www.100md.com
    1.4 显著性检验(Significance test)

    从抽样误差的概念中可以理解,如果观察两种中药治疗真中风病的疗效有差别,可能有两种原因造成,一是单纯由抽样误差所致(即两个样本来自同一总体),二是除抽样误差外,两种中药的效果确实有所不同(即两个样本来自疗效不同的两个总体),如何判断差别是由何种原因引起的,可用显著性检验来鉴别。步骤是:首先对总体的参数作出某种假设,如两种中药总体有效率相等。在此假设的前提下,对样本数据进行处理,计算出两个样本的有效率,再利用概率分布原理,计算出χ2值,由此再计算出相应的概率(P),对原假设应该被拒绝还是接受作出推断。若差异由抽样误差引起的可能性很大,则P值大,如P>0.05,统计上称这种差异为“无显著性意义”。意思是这两种中药来自疗效相同的同一总体,只因抽样误差使表面上有些差别,实质上其疗效是差不多的;若差异超过了抽样误差所允许的范围,则P值很小,如P≤0.05或P≤0.01,统计上称为“有显著性意义”,这时才能认为这两种中药来自疗效不同的两个总体,其差别不能仅由抽样误差来解释。只有此种情况下,才能推断两种中药的疗效有优劣之分。
, 百拇医药
    2 临床资料的类型

    正确区分临床资料的类型是正确选用统计分析方法的首要前提。中医临床随着越来越多的现代科学技术的应用,中医辨证逐步走向量化和规范化,因而临床数据日益增多,按其性质分两大类,计数资料和计量资料。

    2.1 计数资料

    将观察单位按某种属性或类别分组计数,得到各组观察单位的个数称计数资料。又称以属性为标志的分组资料,或称记录每个观察单位的某一方面的特征和性质的资料。

    计数资料又可细分为定类尺度(Nominalscale)和定序尺度(Ordinalscale)两种测量水平。

    属于定类尺度的计数资料又称命名水平,或名又资料、分类资料、命名资料,它的取值通常是文字、字母或代号,即使是用数字表示,也只是一种分组的标志,并不代表数量的大小;其所获得的数据仅能归入不同的差别,而各类别之间没有任何内在的固有顺序或其他联系,如不同的性别,男、女;不同的血型,A型、B型、O型和AB型;不同的证候,气滞证、血瘀证、痰湿证等。由于只是按事物的某种属性计数,只能区分事物的属性或类别的不同、差异,不能反映事物的动态和程度的变化。故,它提供的信息少,若用它来表示疾病的程度及病情的轻重,提供诊断上的参考依据,评价疗效和判断预后等,其意义是有限的。如,分别表现为气滞、血瘀、痰湿证的不同病人,我们无法比较他们病情的轻重。而只能说,这三个患者的证候不同。此类数据仅仅为了命名和分类,此外,没有任何其他意义。
, 百拇医药
    属于定序尺度的计数资料又称顺序水平、有序资料、等级资料或半定量资料,这类数据除了有命名和分类的意义以外,各类别之间具有内在的顺序联系,不同的取值之间有半定量的关系,可以按数量的相对大小或程度的高低排出顺序,可用来比较大小。如治疗效果分为(无效为0、有效为1、显效为2、治愈为3)4个等级;营养状况分(差为1、中等为2、良好为3)3个等级。

    计数资料,无论其是属于定类尺度或是定序尺度,都是以观察单位截然不同的性质归类,所以较少发生归类错误。同时,由于组内变异小,因此较少发生误差。中医临床资料以计数资料居多。

    2.2 计量资料

    对每个观察单位用计量方法测量某项指标数值的大小所获得的资料称计量资料。或称以数量为标志的分组资料。一般用度量衡测量,以不同单位表示。

    计量资料也可细分为定距尺度(Intervalscale)及定比尺度(Ratioscale)两测量水平。
, http://www.100md.com
    定距尺度又称等距水平,它测量的两个数据之间的距离是固定的,可是测量它的单位和零点水平却是人为规定的。典型的例子就是温度的测量,它的测量单位可以用华氏也可用摄氏,可根据不同的需要而定,且其零点水平是不一致的,即0℃≠0。由于定距尺度的这种特点,数据之间差异的关系只能用差值来描述,不能用倍数(比值)来描述。如三个物体A、B、C,其相应温度分别为10℃、20℃、30℃,我们只能说,B、A之间的差等于C、B之间的差,却不能表述为C、A之间差是B、A之间差的2倍。但是,任意两个距离的比却与用什么单位和选择什么水平为零点无关。如:0℃=32,50℃=122,100℃=212,可是(50-0)/(100-50)=(122-32)/(212-122)=1。

    定比尺度又称等比水平,是四种测量水平中最高的一种。通过定比尺度测量的数据具有前三种尺度的全部性质。此外,它的测量零点不是人为规定的,而是绝对的,非任意和具有一定意义的。如身高的度量:我们可用英尺作单位,也可用厘米作单位,但不管其单位是英尺或厘米,其零点水平是绝对的,不能任意改变的,即0英尺=0cm。因为这两种单位具有绝对的零点水平,而任意的两个数据之间的差异,不仅可以用差值来表述,更可以用比值来表述。所以,这种测量尺度的任意两个数据之比是固定的,与测量选择的单位无关。临床资料如年龄、胆固醇、粘蛋白等这些数据均为定比尺度资料。
, http://www.100md.com
    此外,高测量水平资料可向低测量水平资料转换,如血红蛋白测量,得到一组数据,这是定比尺度资料,若按数值大小分正常、轻度、中度、重度贫血4个等级,得到的这组资料为定序尺度资料;若按血红蛋白正常与异常分组,又可得到定类尺度资料。相反,低测量水平的资料无法转换为高测量水平的资料。如以160cm为界值划分为高个与矮个的定序尺度资料,无法转换为定距或定比尺度资料。在中医临床数据中,计量资料以实验室理化检查结果为主。

    3 临床资料的统计处理方法

    当我们从临床上收集来数据后,首先看是计量资料还是计数资料,通常计量资料是连续的,如长度、时间、重量等,连续的资料在理论上是无限可分的;计数资料是离散的,如病人数、手术次数、症状次数等,记录只有整数和零,相邻的两整数之间没有小数。故统计资料又可分为连续性资料与离散性资料两大类。连续性资料的概率分布呈正态分布或近似正态分布,或呈偏态分布,经过对数变换后服从正态分布,临床数据中的同性别、同年龄病人的身高、体重,同性别健康成人的红细胞数血红蛋白量等,及绝大部分实验室理化检查结果和病人住院天数,均符合正态分布,可按正态分布规律处理。
, http://www.100md.com
    离散性资料的概率分布包括二项分布、Poisson分布、超几何分布、负二项分布。其中超几何分布常用于流行病学研究、产品质量检查等;负二项分布用于寄生虫学、医学昆虫学、微生物学及流行病学等方面研究;Poisson分布是单位时间、单位面积或单位容积中某罕见事件的概率分布。在总体比例π很少,样本含量n趋向于无穷大时,二项分布就趋向于Poisson分布,Poisson分布常用于卫生学方面、放射卫生方面及实验室检测方面的数据处理。

    我们在临床中遇到的,如一个病人的治愈或死亡,接触传染源者的感染或未感染等,这时如从阳性率(死亡率、感染率等)为π的总体中随机抽取许多大小为n的样本,则出现阳性数为x(x=0,1,2……)的样本分布即呈二项分布。例如,在临床上根据已往经验用一般疗法治疗胸痹心痛,有效率为66%,无效率为34%,今用某一新疗法,采用一新药治疗胸痹心痛病病人10名,这10个人均有效,问该新疗法是否比一般疗法优。这类问题是通过计算概率大小,来观察疗效,可应用二项分布规律来处理。
, http://www.100md.com
    3.1 计量资料中的连续性资料的统计分析

    对这类资料的原始数据加工是求平均数、标准差和标准误,两均数的显著性检验用t检验,又叫Studentt,多均数的显著性检验用F检验,两事物关联性分析用直线相关和直线回归分析。

    (1)方差齐时:配对设计和自身对照设计的数据选用配对资料的t检验;并行对照设计数据选用两样本均数比较的t检验或u检验(样本含量在200例以下者选用t检验,样本含量在200例以上者选用u检验);两个几何均数比较用t检验。若方差不齐时,两小样本均数比较可选t检验。

    (2)F检验又称方差分析,是检验多个或两个均数间差异显著性的方法。也是检验几个因素或标识的交互影响的方法,临床上的完全随机设计资料(包括各组样本含量相等与各组样本含量不等)、随机区组设计资料,各组均数间相互比较(包括各组样本含量相等与不等),几个处理组均数与一个对照组均数比较,拉丁方设计资料、2×2析因设计资料、“23设计”资料、或“2×2×2设计”资料、正交试验设计资料”均可使用F检验进行显著性检验。
, 百拇医药
    (3)直线回归与相关是通过计算回归系数与相关系数来分析事物之间关联性的。显著性检验可以用t检验或方差分析。但根据原始数据的多少分小样本(n<40)和大样本两种具体计算方法。

    3.2 计数资料的统计分析

    这类资料的原始数据的加工是求相对数(率和比),率之间的显著性检验用χ2(卡方)检验。

    由于中医临床数据多为计数资料,如症状、舌苔、脉象等,故χ2检验十分常用。临床上两组计数资料间比较,如甲药治疗胃脘痛病有效率为60%,乙药治疗胃脘痛病有效率为70%,问两药之间是否有差异;两个以上样本资料间比较,如中药治疗慢性肾小球肾炎,以1个月为1疗程,第1个月治疗有效率为30%,第2个月的有效率为26%,第3个月的有效率为35%,问3个疗程的不同有效率之间是否有差异;两个或多个样本资料之间相关分析,例如上例中求各有效率与疗程之间有无显著关系;配对计数资料的比较等,这些资料均可用χ2检验处理。其中常用计算方法为四格表法,行×列表法(R×C法)。
, 百拇医药
    3.3 计量资料中的总体不明确或开口资料及计数资料中的等级资料的统计分析

    这些数据用非参数统计方法进行显著性检验。说到非参数统计这里简单介绍一下概念。

    前面所提到的计量资料,尤其是连续性的计量资料,它的总体分布的函数形式基本上呈正态分布,而我们所做的两样本均数比较的t检验和多个样本均数比较的F检验,都是以假定总体呈正态分布为先决条件的。目的是推断两个或多个总体均数(即正态总体的参数)是否相等,这类统计方法统称为参数统计。

    但实际工作中,尤其是中医临床数据中,资料的总体分布函数形式往往是不知道的,或知道很少,如仅知总体分布是连续型的或离散型的,此类资料不符合参数统计方法的条件,它并不依赖于总体分布的具体形式,应用时可以不考虑被研究的对象为何种分布及分布是否已知,此时比较的是分布而不是参数,这类统计方法统称为非参数统计。

, 百拇医药     非参数统计不考虑资料的分布类型,直接用数据的符号、大小顺序号综合判定划分的名次、严重程度、优劣等级等说明或比较两个或几个数列的统计方法。中医临床数据中大部分可用非参数统计方法处理,但我们也要注意:对于适宜用参数统计方法的资料,若用非参数统计处理,常损失部分信息,降低效率。

    非参数统计包括秩和检验、Ridit分析、两事物关联性用等级相关分析。

    3.3.1 秩和检验

    适用于配对资料的检验。例,应用某方治疗热病患者20例,求该药是否引起血清中白细胞含量在治疗前后的变化。这类问题可用符合等级检验(Wilcoxon法)方法处理。但配对数大于6对。

    也可用于成组资料的检验,但若资料呈正态分布则用成组资料的t检验。

    可用于等级资料的两样本比较,按等级分组的两组资料,如尿蛋白测定结果分组为:-,+,,等,或某些频数表资料的首末两个组段没有明确下限和上限,如血红蛋白值(g/L)划分组段为<60、60~,90~,120~,160~等。这类资料不能用两样本比较的t检验,可以用秩和检验中的Wilcoxon、ManuandWhitney法,又叫等级和检验法。
, 百拇医药
    对于完全随机设计的多个样本比较,此类数据如方差齐同,可采用F检验,否则采用完全随机设计的秩和检验,即H检验(KruskalandWallis法)。我们临床上遇到的各种等级分组资料,如临床疗效分治愈、有效、好转、无效;症状的无、轻、中、重等。这类数据可用H检验法。例,临床上用加味定喘汤治疗肺胀病人,可以有几种不同病情,疗效分控制、显效、有效,无效,求疗效是否有差别。

    随机区组设计资料的多个样本比较,此类资料若方差齐同,可采用双因素F检验,否则可用随机区组设计的秩和检验,M检验(Friedman法),例,临床上20名乙肝病人在用某药1月后观察肝功能在治疗前后变化,问此药在治疗后1个月内不同周数(1、2、3、4周)的肝功能差别有无统计意义。

    3.3.2 Ridit分析

    它适用于下列资料:①按等级分组的资料,如疗效分治愈、显效、好转、无效,症状的无、轻、中、重,尿蛋白:-,┼,;此类资料可用χ2检验,但χ2检验只能说明比较各组的构成是否相同,不能说明对比各组的疗效优劣、症状轻重。②数据不能确切测定的计量资料,如年龄分:<35、35~、50~、60~、70~、80~、>90等。此类数据可以转化成计数资料用Ridit分析处理。
, 百拇医药
    临床上可用于样本与总体比较。例,用中药甲治疗肺胀2000例,疗效很好,在甲药基础上加以改进,制成一种新药,中药乙与甲药相比,不知乙药疗效如何,为此,我们又进行了100例临床试验,结果出来后,问两药治疗肺胀效果是否相同?或是否有差别?

    还可用于两组平均Ridit值比较。例。甲、乙两中药对200名患肺胀的同一证候的病人进行治疗,问两药效果有无差异?

    又例:研究疗效与病程长短关系的资料,已将病程年数分组,问疗效与病程是否有关系?

    也可用于多组平均Ridit比较。例,用4种中药方剂治疗胃痞病患者共510例,试比较4种中药方剂疗效差别有无显著性?

    3.3.3 等级相关

    适用于:①不服从双变量正态分布,而不宜作积差相关分析;②数据的总体分布类型未知或已知不是正态的双变量;③原始数据是用等级表示。

    临床常用的为Apearman等级相关分析,等级相关系数的显著性检验用t检验法。

    综上,介绍了中医临床资料处理过程中常用到的一些单变量统计分析的基本使用方法,即在什么情况下,用什么样统计方法进行处理,至于具体运算方法、步骤,由于统计软件如SAS、SPSS在计算机上的广泛应用,我们可以不必掌握,而借助统计软件来计算结果。

    收稿日期:1997-11-14, http://www.100md.com