当前位置: 首页 > 期刊 > 《健康大视野·医学分册》 > 2006年第2期
编号:11088285
论文撰写中常见的统计学问题及其处理(1)
http://www.100md.com 2006年2月1日 《健康大视野》 2006年第2期
     绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。显然,经正确统计处理的结果可信度高,论文的质量也高。

    据不完全统计,在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背。如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,χ2=7.164,P0.05),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。类似问题文稿中还常有出现。现就文稿中常见的统计问题及其相应的处理方法简述如下。

    一、 常用的统计术语

    统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。该计量资料,经t检验显示t=0.780,P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而P值越小,只能是更有理由拒绝原定的假设。

    5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验。对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检验。因为在同一t值的界限上,单侧检验的概率(P)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计意义的结论,不可随意制定。一般讲,绝大多数研究以采用双侧检验为妥。

    (二)t′检验与t检验的区别

    当两样本均数的方差非齐性时,应以t′替代t检验。例如:甲组32例血清某指标值为53.9±49.6(μmol/L);乙组6例的结果为26.6±7.2(μmol/L),若不考虑两样本方差大小,t检验示t=1.331,P>0.05,提示两组血清该指标的平均含量差异无显著意义。但先作方差齐性检验,F=47.4,Pt′0.012.875,P0.05)。故可认为,单据本研究结果是难以得出上述临床上认可的结论的。这涉及到上述“统计无显著意义,而临床却是有意义”的问题,应进一步复查或增加样本测试。杜绝单纯根据百分率的大小贸然下结论。

    例2.某药治疗感染衣原体(CT)的中、晚期孕妇各11例和36例,她们的新生儿感染CT数各为3例和23例。χ2检验得χ2=4.570,P0.05。显然,正确结论恰与上述相异。

    [ 下 页 ], http://www.100md.com
1 2下一页