当前位置: 首页 > 医学版 > 医学理论 > 预防医学与公共卫生 > 预防医学
编号:58258
第十七章 统计表和统计图
http://www.100md.com 《预防医学》
统计表和统计图都是将已整理的资料用简明的表格或图形表达出来,使人获得明晰而直观的印象,避免冗长的文字叙述,便于比较分析。
一、统计表
统计表(statistical table)是从整理表中选出需要的资料,经过统计加工为各种指标后,列成便于对比分析的表格。
(一)统计表的结构和要求
表的结构要简洁,最好一事一表,避免臃肿庞杂。
例17-1 吴氏等研究某些疾病发生高催乳素血症的频率,结果归纳如表17-1。
表17-1 高催乳素血症的发生率
诊断
总例数
高催乳素血症例数
发生率(%)
嫌色细胞瘤
80
62
77.5
肢端肥大症
41
17
41.5
蝶鞍部其他肿瘤
29
10
34.5
原因不明闭经
67
14
20.9
月经量少
20
3
15.0
单纯泌乳
5
0
精神分裂症
1
1
资料来源:吴建中等 中华妇产科杂志20:34,1985年
以该表作为典范,说明统计表的结构特点:
1.标题
简练,用词确切,能表达中心内容,左侧有表号以备查考(必要时还应标明资料来源和时间)
2.标目
有横标和纵标目,横标目又称主辞,是研究事物的,通常位于表内左侧;纵标目的是研究事物的,又称宾辞,列在表内上方,其表达结果与主辞呼应,读起来就是一完整句子。例如第一行可读成:“嫌色细胞瘤80例,有62例出现高催乳素血症,发生率77.5%。”
3.线条
力求简洁,该表除有较粗的顶线和底线外,表内只有一条隔开纵标目的的细横线,简单明了。
4.数字
位置上下对齐、准确、率的小数点后所取位数也上下一致。该表最后两个率因为构成的绝对数太小,作者在发生率栏中用“…”来表示,这是对的。一般如果某格无数据或暂缺资料,也可用“-”或“…”来表示。
5.内容排列
一般按事物发生频率大小顺序来排列,对比鲜明,重点突出。
(二)统计表的种类
常用的有四种:
1.简单表
常用以比较互相独立的统计指标,主辞未经任何分组。表17-1即属简单表。
2.分组表
主辞按一个标志分组,结构形式与简单表基本相似。通常设有合计栏,以利说明综合水平。
例17-2 1984年上海县随机抽查30岁以下的正常人群的麻诊免疫水平,共检查733人结果统计如表17-2。
表17-2 1984年上海县部分健康人群麻疹抗体
年龄(岁)
检测人数
阳性人数
阳性率(%)
平均滴度之例数
0~
124
123
99.2
43.52
5~
141
141
100.0
37.64
10~
147
147
100.0
21.43
15~
109
102
93.6
15.50
20~
91
89
97.8
17.94
25~
121
119
98.3
19.78
合计
733
721
98.4
25.14
资料来源:郑平等 上海医科大学学的增刊53页,1987年
表17-2的主辞是按年龄分组的调查对象,亦就是按年龄一个标志分组,所以属于分组表。
3.复合表
主辞按两个以上标志分组。在安排上可将部分主辞放在表的上方,与宾辞配合起来。
例17-3 胡氏介绍改良阴道纵隔手术治疗子宫脱垂132例,疗效统计表如表17-3。表 17-3 132例子宫脱垂手术前后症状比较
症状
手术前
手术后
例数
%
例数
%
下坠感
126
95.45
13
9.85
性生活不满意
123
93.18
3
2.27
腰酸痛
47
35.60
9
6.82
排尿困难
36
27.27
0
0
压力性尿失禁
17
12.88
0
0
资料来源:胡丽华 中华妇产科杂志20:56,1985年
复合表是否需要合计应从有无意义来决定
4.列联表
把数据资料列成交叉分类的表格,使一种属性的亚类以水平方向(行)表示,另一种属性亚类以垂直方向(列)表示。这样行变量与列奕量之间的联系便显示出来,并加以检验。最简单的列联表是四格表(2×2表);还有多维分类形式的列联表。
例17-4 罗氏等应用国产放射免疫检测试剂“北方RIA”与进口试剂“AUSRIA”对肝癌发高发区居民乙型肝炎表面抗原(HBsAg)进行配对检测,结果统计如表17-4。
该表资料可以应用配对x2检验法作进一步分析,具体方法将于第二十章介绍。
表17-4 两种试剂检测HbsAg结果比较
北方RIA
进口AUSRIA
合计
+
-
+
244
107
351
-
149
1146
1295
合计
393
1253
1646
资料来源:罗斯等 肿瘤论文汇编125页,1987年广西壮族自治区
二、统计图
统计图(statistical diagram)一般是根据统计表的资料,用点、线、面或立体图像鲜明地表达其数量或变化动态。医学统计常用的有线图、直方图、长条图、圆形图和统计地图等。
(一)制图通则
1.根据资料性质和分析目的正确选用图形。
2.要有确切的标题和编号,其位置通常安排在图体下面。
3.在同一图内比较几种不同的事物时,须用不同的线条或颜色表示,并附图例说明。图例位置要与图体协调、美观;如有碍于形象,则不要放在图体内。
4.有纵轴和横轴为坐标的图形,一般都以第一象限为准则作图,以两轴交点为起点,纵、横轴都应有标目,并注明尺度的数量单位。
(二)医学常用统计图及绘制法
1.线图(line diagram)
(1)适用于连续变量资料。说明某事物因时间、条件推移而变迁的趋势。
(2)横轴常用以表示某事物的连续变量,纵轴多表示率、频率或均数。
(3)纵轴采用算术尺度,从零开始。如果图形的最低点与零点差距很大,则可在纵轴基部作折断口,使线段降低以求美观。横轴可以不从零开始,如果以组段为单位,则每组均以组段下限为起点。但绘图的坐标点则应以组段中点为宜。
(4)同一图内不宜有太多曲线,以免混淆不清。如有几条线作对比,则用不同线形来区别,并有图例说明。
例17-5
根据成都学龄前儿童生长发育的3年追踪调查,身高的年增长值按性别分组统计比较如表17-5和图17-1。因为身高发育是连续性变量资料,用曲线图来表示是适宜的。该图很微妙地反映出儿童少年生长发育期的规律:女孩身高从8岁起增长很快,10岁左右达到突增高峰。男孩则在10岁起才迅速增长,13岁左右达突增高峰。这和生理上女孩青春期了育比男防早一些,是十分吻合的。
表17-5 1979~1982年成都学龄前儿童身高年增长值(cm)
年龄
(岁)
人数
均数
标准误
人数
均数
标准误
7~
72
5.90
0.93
108
6.07
0.94
8~
198
5.88
1.01
213
5.42
1.58
9~
322
5.17
1.13
234
6.18
1.84
10~
351
5.26
1.53
338
6.78
1.72
11~
356
6.49
2.30
370
6.59
1.72
12~
322
7.72
2.45
316
5.13
1.96
13~
296
7.93
2.38
293
3.75
2.16
14~
266
4.55
2.61
200
1.46
1.27
15~
173
3.16
2.12
121
1.24
1.10
资料来源:张兴儒等 中华预防医学杂志21(6):338,1987年
图17-1
成都市男女学生平均身高年增长值曲线
另外不有一种线图叫半对数线图(semilog line diagram),纵轴用对数尺度,横轴仍用算术尺度。这种图常用于比较两组相对数的比值相差较大的动态数列。原因是同样的增长速度在对数尺度上的距离是相等的。例如表17-6中的三组数据,由时间A到B分别绘在算术格纸(图17-2a)和半对数格纸(17-2b)上,呈现两种不同的结果。a图三条直线坡度相差悬殊,这是三组数据的绝对差相差悬殊之故;b图则因三组数据的对数差相等,下降坡度亦一样。
图17-2
三组数据绘在算术(a)和半对数(b)格纸上的线图比较
表17-6 绝对差与对数差的比较 A→B
绝对差(A-B)
相对比(A/B)
对数差(IgA - IgB)
1000→100
900
10 Lg1000-lg100=3-2=1
100→10
90
10 Lg100-lg10=2-1=1
10→1
9
10 Lg10-lg1=1-0=1
下例进一步说明半对数线图应用的实际意义。
例17-6 美国疾病控制中心(CDC)报道,自从应用白喉类毒素作为儿童常规免疫接种后,白喉发病率和死亡率明显下降,但病死率仍停留在一定水平上。三者动态变化表达如图17-3。
图17-3
应用类毒素免疫接种后的白喉发病率、死亡率和病
死率的动态变化比较(1920~1975年)
(资料来源:CDC No.12,1978,Atlanta,Ca,USA)
该图很形象地表明在55年内白喉发病率和死亡率下降速度基本一致。但两组数据的前后绝对差却很悬殊,如果用算术格纸来描绘,直观上将产生发病率下降坡度明显大于死亡率下降的错觉。图中还反映了白喉病死率自1920~1970年间变化不明显,与白喉死亡率不同;这里存在两个率的含义不同的原故,本教材的第二十四章将予阐明。
2.直方图(histogram)
(1)直方图是以面积表示数量,适用于表达连续性资料的频数或频率分布。
(2)横轴表示变量,尺度可以不从零开始。同一轴上的尺度必须相等。
(3)作图时各直条的宽度应等于组距,高度应等于该组的频数或频率。组距相等的分组资料才能作图,否则应先换算成相等组距。以下是120例T3比值频数表作图(图17-4)。
图17-4
120例正常血浆结合
125I-Ts树脂摄取比值分布
将各组直方的顶端中点相连,即成多边图,也可用来表示连续性资料的频数颁布情况。
3.直条图(bar chart)
(1)直条图是用等宽直条的和长短来表示各统计量的大小,适用于彼此独立的资料互相比较,有单式和复式两种。
(2)作图时,一般是以横轴为直条图的基线,纵轴表示频数或频度,从零开始;直条间的距离一般以条宽的1/2为宜。排列顺序若非自然顺序资料,则按由高到低的次序排列,便于比较。
(3)复式直条图的制图要求与单式相同,但每组的直条最好不要过多,同组直条间不留空隙,组内各直条排列次序要前后一致。
例17-7 上海县统计了1960~1962年和1978~1980年两段时期的居民前10位死亡原因。现将其中可配比的9对资料绘成直条图(图17-5)比较如下。
图17-5
上海县居民在1960~1962年与1978~1980年间
死亡原因变化的比较
资料来源:Gu Xingyuan et al ,AJPH72(Sup.)p.22,1982
该图给人的鲜明印象是原居首位的传染病死亡率与第6位的恶性肿瘤死亡率互易位;同时脑血管病和心脏病分别进到第2位和第3位。
4.百分条图(percent chart)用以表达构成比的图形,绘制简便,而且可将多条并列作比较,以阐明疾病的动态变化。
例17-8 某矿采用湿式作业,粉尘浓度明显下降。若干年后,新发矽肺减少,历年存活矽肺患者的期别也随之发生变化。作者根据表17-7统计资料绘制百分条图比较如图17-6。
5.圆形图(circular graph)用途同百分条图,是以圆的半径将圆面分割成多个大小不等扇形来表达构成比。作图法是先将各个百分比乘以3.60,获得圆心角度数,按其大小排列从0时开始,且量角器顺时针方向划分为一系列扇形。图17-7是某厂某年工伤分析百分比图。
表17-7 某矿1961~1965年矽肺患者期别构成比
矽肺分期
1961年
1962年
1963年
1964年
1965年
例数
%
例数
%
例数
%
例数
%
例数
%
48
50.5
54
47.8
61
43.9
64
41.3
67
39.9
33
34.7
41
36.3
53
38.1
60
38.7
66
39.3
14
14.8
18
15.9
25
18.0
31
20.0
35
20.8
合计
95
100.0
113
100.0
139
100.0
155
100.0
168
100.0
图17-6
某矿1961~1965年各期存活矽肺构成比的动态
图17-7 某年某厂工伤病例百分比
6.点图(scatter diagram)表示两种事物变量的相关性和趋势。医学上常用于观察两种生理指标之间的动态变化关系,或临床上两项检测结果之间的量变关系。点图绘测方法是先绘出适学的坐标,一般以两轴正交点为0点,但也可按两变量的全距中最小值起点加以高速调整。x变量定在横轴,y变量定在纵轴;然后将每受检者测得两变量值,找出P(x,y)所在的方位,并绘出各自的坐标点。最后根据点的颁布情况进行分析。
例17-9 某中学测得最高年级100名男生身高、体重的结果,绘成点图如图17-8。
7.疾病状况动态结构图
是有目的地观察几种主要病伤类别构成的动态,从而评价卫生工作效果,指导以后工作的规划和策略。图17-9是美国1900~1973年间11种主要传染病历年占总死亡率百分比的动态;从1900年占40%到1970年仅6%;相应的中风、肿瘤和心脏病在该期间从20%上升到59%;意外事故死亡所占比重则变化不大。
以上只介绍几种常用统计图、表范例和绘制通则,读者可根据资料内容和需要灵活运用和发展。
图17-8
某年某校100名男生身高体重相关图
图17-9 1900~1973年间美国传染病和慢性疾病死亡率构成动态变化
, http://www.100md.com