研究设计_统计学_医学科研中假设的形成及其检验

医学科研中假设的形成及其检验

http://www.100md.com 《医学临床研究》 2000年第1期

     作者：熊国强邓瑞姣

    单位：熊国强(湖南医科大学卫生统计学教研室长沙 410078)；邓瑞姣(湖南医科大学护理学院长沙 410078)

    关键词：研究设计；统计学

    湖南医学000121 【中图分类号】 N32 【文献标识码】 B 【文章编号】 1001-9421(2000)01-0047-04

    在研究事物客观规律中，必然要建立某种科学的假说。假说是根据一定的科学证据和科学理论，对所研究的问题提出假定性的说明或探索性的解释。医学科研必须先有其假说，后有其设计，调查、实验、临床观察工作。后续工作仅是验证假说的根本途径。因此，建立假说是科研选题、设计(专业设计和统计学设计)的核心环节。

    1 假设形成的方法
, http://www.100md.com
    医学的发展形式就是在不断地提出新假说、建立新理论，完善旧理论、检验假设、修正和发展假说的过程。然而，在建立假设时，必须认识到事实依据和理论基础是建立假设的两大支柱这一重要性。假设的形成必须经过一个严密的、艰苦的逻辑思维过程。常用的基本逻辑推理方法有下述几种。

    1.1 归纳演绎法人们对事物的认识存在两个过程：由个别到一般和由一般到个别；前者称归纳，后者谓演绎。归纳是演绎的基础，演绎是归纳的指导，归纳与演绎相结合是科研中重要的基本逻辑方法。在医学科研假设中，归纳法应用最多，尤其是研究事物或现象间的因果关系时更为突出。统计学中一系列回归分析(两元或多元等)就是分析这类问题的数量依从关系。通常可以根据事物间的性质、差别等特点，将归纳法分为求同、求异、共变、同异共用和剩余法。演绎实际上就是推理。它是根据已知事物的规律再推未知事物的方法，故又称类推法。演绎原理的三级论法，即从大前提与小前提而得结论。如：人有灵感(大前提)，王二是人(小前提)，王二有灵感(结论)。归纳法的三级论法为：张三、李四、赵五，及其他若干名字都指人(前提)，张三、李四、赵五，及其他若干名字的人都有灵感(前提)，凡是人都有灵感(结论)。两种方法从上面两个例子可
, 百拇医药
    见一斑。因此，演绎的结论可以完全正确，而归纳推论的可靠性仅占一定的概率。

    1.2 比较分类法首先比较对象间的异同，后根据异同将对象分为不同类别，统计学中的判别分析法是分析和区别事物类别的有力工具，可用于诊断、治疗、预后和预防等各个领域。

    1.3 分析综合法即将整体分解为部分或将复杂的事物分解为简单要素，把动态化为静态进行研究。综合是与分析相反的一种思维过程，在综合指导下的分析，在分析基础上的综合，这也是医学科研中的一个重要特点。因为医学研究的对象大多是复杂的机体，采用分析与结合相并的研究方法是符合唯物主义认识论的。如选拔体操运动员时，必须考虑对象的先天和后天的各种因素；后天因素又要考虑对象的心理素质、生理生化因素和形体因素等很多指标。统计学家往往在单指标分析的基础上进行综合评估，选用综合性指标(少数)替代原指标(多数)。这类方法有主成份分析、因子分析和典型相关等。

    2 假设的作用
, http://www.100md.com
    医学科研工作者在各自领域中不断地创新和探索新的思路。当产生了一种假设思想时，就需要进行新的实验与观察，就有可能导致新的发现，但难免出现错误的结论。因此，假设的正确与否决定着科研的成败。假设在科研中具有举足轻重的作用。

    2.1 为科研创新提供依据医学科研的最终目的在于发现新事物与形成新理论。实际上它们都是某种假设被验证后的具体体现形式。所以，假设是为了发现新事物与形成新理论提供依据或研究蓝图。

    2.2 为研究设计提供方向研究工作是一个探索未知事物和规律的过程，倘若没有假说，便无法着手解决这一未知问题。针对所有研究的问题有的放矢地提出假设，即为研究设计提供了目标和思路，使研究的主攻方向得以明确集中，技术路线能够具体可行，从而避免盲目性与被动性。

    2.3 为科学发展提供焦点在科学发展的过程中，对于同一问题的解决，需要多途径多方法的探索，各个途径和方法都可能提出假设，那么初始阶段必然是众说纷纭，各持己见，最后通过分析综合，统一认识。这样，假设起到了提供探索与讨论焦点的作用。通过各家学说与观点的争议和评论，从事物的不同侧面揭示矛盾，开阔思路，克服片面性，促进科研向纵深发展，推进科学技术工作的进步。
, 百拇医药
    3 假设的性质

    研究假设一旦形成必须具备如下一些共性，才能经得起推敲和证实。

    3.1 科学性假设来源的科学性主要强调来源的客观性。假设的提出应当是以一定事实为依据的，不能主观凭空幻想。这些事实依据可以是个人长期观察和实践的结果，也可以是他人的经验总结。新建假设既能解释原有理论说明的事物和现象，又能解释原有理论不能说明的问题。假设能够解释的覆盖面越大，表明假说反映客观规律的程度越好。

    3.2 假定性假设毕竟是经过科学思维作出的推测性设想，且设想的是一个未知的问题，这种设想仅为一种假定性说明，它具有不确定的性质，在医学研究课题中尤其这样。因生物体是一个复杂的有机体，内外环境的影响因素较多，假设的不确定性成分更大。假设的表达形式可以是一元或多元的。现在电脑的普及、软件SPSS和SAS的广泛应用，为解决多元分析验证多元假设提供了广阔的空间和便利。
, http://www.100md.com
    3.3 预见性假设的预见性是假设价值的体现，假设的提出具有可验证性。实践是检验真理的唯一标准，同样适用于医学科研工作。例如：1997年诺贝尔物理学奖获得者朱棣文创立的激光电子冷凝学说经过了10年时间的验证，证实了该成果的应用将对化学、物理和医学诸多领域产生深远、巨大的影响。

    3.4 曲折性完整和真实的假设形成，一般不可能一次完善，大多数要经过若干次假定→检验→再假定→再检验，根据检验的客观证据，不断修改与补充，才能逐步完成。在验证假设时，有的假设可能被否定，有的假设可能起到了提示、启发和桥梁的作用。所以，一个正确假设的建立，往往需要经历实践→认识→再实践→再认识的一个螺旋式发展过程。

    4 假设检验的分类

    假设形成以后，研究者就须着手设计和实验(包括调查和观察等)来验证这种假设。其后续工作包括确定观察对象和指标。所取指标是在研究目的指导下进行分类(定量、定性或是等级)、采用相对应的统计方法来验证这种假设。统计学的主要任务是统计描述和统计推断，统计推断又包括参数估计和假设检验。参数估计即对某变量的总体特征进行区间估计(例如μ，π，σ，β，ρ等)。
, http://www.100md.com
    4.1 按参数性质分类假设检验是根据样本值来判断随机变量是否服从某种分布函数，或判断某一样本是否由某一已知参数的总体中产生。前者称为总体中的个体值分布检验，后者称为总体的参数检验。

    进行假设检验时，一般从样本值出发判断某“假设”是否成立。例如以样本的均数与方差作为参数的点值估计值，拟合正态分布，然后检验样本的频数分布与正态分布的假设是否矛盾，这就是拟合优变检验。又如已知两个正态总体的方差相等(数理统计模型的要求)，以

，

₂作为总体均数的估计值，检验μ₁=μ₂是否成立，这就是两个均数差别的假设检验。

    4.2 按检验性质分类假设检验按其检验性质可分为简单假设与复合假设。设有一个分布相依于多个参数，如果某一假设对于这些参数中每个参数分别指定了唯一的值，则称为简单假设。例如标准正态分布中指定其均数等于零、标准差等于1。如果只给一部分参数分别指定了唯一的值，剩下若干个参数未指定，则称为复杂假设。这类方法在多元分析中被广泛采用。
, 百拇医药
    5 假设检验的基本程序

    当你对假设检验的目的和方法已经明了和熟悉的条件下，不妨列举一个简单的医学例子予以说明。生理学已经证实：血液中血糖浓度下降，通过神经反射，产生饥饿感觉，空腹时间越长这种饥饿感越强烈。在未证实之前，生理学家肯定曾探索和验证这样一些假设：血糖浓度是否与空腹时间长短有关，饥饿程度是否与血糖浓度有关，餐饮前后血糖浓度是否相同。若选用后者的假设进行检验，则餐饮前后血糖浓度作为观察指标，被试因素为用餐条件，被试对象为正常人(排除了一切影响血糖浓度的疾病、药物等因素)；且假定血糖值在人群中服从正态分布。上述现象可采用自身配对设计且符合配对t检验的条件。具有事实依据和理论基础两大支柱的保障，可以进行假设。

    5.1 建立假设 ①进餐不会影响血糖浓度的高低，即处理因素无效。假设是对总体特征的表述。本例推论的总体是假定的，包括无数个受试者进餐前后血糖值的差值，差值以d表述，差值的总体均数以μ_d表述，因而可写成H_o:μ_d=0。H示Hypothesis,0示Null(Null无效，零的意思)。H₀又称为零假设、无效假设或原假设。②备择假设：H₁：μ_d≠0，即进餐会影响血糖浓度的高低(处理因素有效)。H₁不等于零表示研究者在建立假设时不知道处理因素能否引起效应指标(血糖值)升高或者降低，因而称为双侧检验。如果认为只会引起升高则H₁：μ_d>0;反之下降则H₁:μ_d<0。这两种情况称为单侧检验。如何确定单双侧问题完全依赖于研究者密切结合本专业和他人经验来决定，它产生于假设形成的过程中。③H₁是与H₀相联系而对立的条件，不是平行的条件。H₀是验证的主题，研究者是站在H₀的角度去分析、认识事物或现象，只有在H₀被拒绝的情况下才接受H₁。④确定α的大小，α是在H₀条件成立的情况下，允许将无差别的事物判断为有差别的概率大小。一般定为0.05，根据研究目的等条件可以取大或取小。⑤H₀和H₁的具体表述随变量性质、分析目的、设计类型和检验方法而异。如上例属配对设计、数值变量且符合正态分布，宜作单侧的t检验(进餐只会引起血糖值升高)。
, http://www.100md.com
    以上是参数法检验，对总体特征的推断须落实到参数μ_d，有时还可落实到其它参数如σ，ρ，β等。若为非参数法检验，则对总体特征推断落实到分布类型。

    5.2 检验统计量计算检验统计量的目的在于验证假设的真实性。①无论参数法或非参数法检验，都是以统计量的分布为推理依据的。样本的统计指标称为统计量，而检验统计量的意义是在H₀条件指导下，统计量与假设的参数之差相当于抽样误差(标准误)的倍数。此值已消除了原来单位且标准化了，标准化的目的在于比较现有事物与假设事物之间有无差别。如本例，

式中

为血糖值差值的样本平均数，μ_d为差值的总体均数，假设它等于零(处理因素无作用)，S_为差值的样本均数的标准误(表示

抽样误差的大小)，S_d为差值的样本标准差(表示个体差值的变异程度)，n为样本含量。上例只抽取了一个样本，且计算了一个t值，在H₀条件成立下(μ_d=0)，可以重复抽取无数个样本，那么可以计算出无数个t值，它们就构成了t分布。t分布的决定系数是自由度(υ)，υ=n-1。意思就是说样本含量不同其t分布曲线的形态就不同。②推理的基本思想是反证法。意思是如果在某一统计量的概率分布中，抽得现有样本统计量甚至更大的统计量的概率P值很小，就可以怀疑样本数据与所设H₀有矛盾，而这种矛盾不能用抽样误差来解释，故拒绝H₀；相反，若抽得现有样本统计量甚至更小的统计量的概率P值较大，也就是样本数据与所设H₀虽不一致，但仍可用抽样误差来解释，就没有理由拒绝H₀。③确定P值的大小，P值的大小取决于α值(在建立假设时确定的检验水准)，自由度υ和现有的检验统计量(本例为t值)，三者的关系依赖于数理统计理论推算出来的界值表。当α值和自由度一定时，就可查到对应的界值(在t值表中)。如本例的界值可写为t_α，υ然后以计算出来的t值与界值比较。若t>t_α，υ则P≤α；若tα，υ，则P>α。
, 百拇医药
5.3 判断结果判断结果实际上就是在假设检验后对所比较的事物而确定的结论，这种结论一般包括两个部分：统计结论(统计学意义)与专业意义。①统计结论是根据所算检验统计量的值和自由度查得的相应P值，与检验前确定的检验水准α比较所下的结论。一般要求写出如下内容：检验统计量的值、P值范围、在α的水准上是否拒绝H₀、事物间有无差别(相关、回归是否成立等)。如上例的统计结论为：若P≤α，则拒绝H₀，这就是“有显著性”的同义语。按反证法的逻辑推断，必将导致接受H₁。可以认为

与μ_d比较有差别。若P>α，则不拒绝H₀，这就是“无显著性”的同义词。按反证法的逻辑推理，不拒绝H₀，却未必蕴藏着H₀的真实性。而从决策论的观点，只好接受H₀，或者说，暂时接受它。可以认为

与μ_d比较无差别。②专业意义是根据统计结论，同时结合研究目的以及专业知识、实验设计、实验过程、资料整理分析等情况作出。如上例：有差别时，则可认为用餐能升高血糖值；无差别时，则可认为用餐前后血糖值无变化(暂未发现处理因素有效)的结论。③写结论时应注意的几点：必须根据预定的H₀，H₁与α值来下结论；写出的结论是统计推断的结论，具有概率性，不论拒绝或不拒绝(或接受)H₀都可能发生误差，所以在结论中不宜用“证明”、“证实”或其他类似的肯定词语；专业意义最好由研究者本人作出，让他联系自己专业审慎地作出切合实际的结论。
, http://www.100md.com
    6 假设检验中产生的两类误差(α与β)

    假设检验是根据样本数据推断总体的特征，而总体参数是人为假定的，即使作出了统计学的结论，对于真实的总体参数仍然是未知的。所以，不论假设检验的结论为拒绝H₀而接受H₁，或为不拒绝(或接受)H₀，都有把结论下错的可能性。

    6.1 第一类误差(错误)α 在假设检验时，拒绝了真实的H₀(同时接受了H₁)所产生的误差称第一类误差。第一类误差的概率以α表示，一般取α=0.05，当P<0.05时，则拒绝H₀条件，认为事物间的比较有差别。但会发生错误，意思就是说，在H₀条件下，重复抽样100次，作100次检验，平均发生这种错误的次数小于5次。显而易见，P值越小越有理由认为事物间有差别，然而并不能说明参数间差别的大小。
, 百拇医药
    6.2 第二类误差(错误)β 在假设检验时，不拒绝实际上不成立的H₀(接受H₀)所产生的误差称第二类误差。第二类误差的概率以β表示。β只有与特定的H₁结合起来才有意义。β的大小很难确切地估计，但当样本含量n确定时，α小β就大，反之α大则β就小。1-β是假设检验的效能或把握度，它是揭示真实H₁的概率，1-β越大则假设检验的效能越高。为了同时减少两类误差，切实可行的办法是增加样本含量(两组或多组观察单位的个数)，减少其抽样误差，使其两种概率分布重叠部分尽可能缩小。

    7 检验水准α的大小问题

    检验水准α是在作假设检验时预先对P值确定的一个概率值，根据P与α的关系来判断H₀和H₁的取舍。α也是可能发生第一类误差的最大值(由研究者自定)。P值是在H₀条件下的总体内产生某个样本以及更极端的样本的概率，而不是说样本以及更极端的样本来自H₀的总体的概率。前者是先验概率，后者是事后概率。这就好比一名射击运动员打中飞碟的概率并不等于该飞碟被这名运动员打中的概率。研究者是站在H₀的立场(条件)下去分析、认识、判断事物间的差别。确定α值时应注意几点：①α值是在科研设计(调查、实验和临床观察)中根据研究目的预先确定的，不应在算出P值之后再来选择。②在药物筛选，肿瘤调查筛选，不同人群中某指标的分布等，可将α值定小一些，以提高鉴别的水准。对于目的在于检验分布类型、齐性或拟合优度，可将α值定大一些。当然，如能结合β值来定α值则更好。③正确区分备样假设H₁的单双侧、对于对称分布的检验统计量，同一检验统计量界值的单侧α，而双侧为2倍α，如双侧的U_0.10与单侧的U_0.05都为1.64。因此，在满足用单侧检验的条件下，单侧检验的把握度大于双侧检验的把握度。

    图1 显示骨肉瘤组织中VEGF阳性信号呈全浆型(SP法×400)

    图2 显示骨肉瘤组织中微血管(SP法×200)

    【作者简介】熊国强(1949～)，男，湖南益阳市人，副教授，硕士生导师，1995.10～1998.1留学美国。主要从事多元分析(包括生存分析)在医学中的应用及统计方法在肿瘤、心脑血管疾病和行为医学中的应用研究。

    【收稿日期】 1999-12-28, 百拇医药

百拇医药网 http://www.100md.com/html/analecta/2000/01/01/28/588.htm