主成分分析及与TOPSIS法用于医院候诊室卫生评价的对比分析
作者:潘庆仲
单位:山东潍坊医学院基础部 潍坊261042
关键词:主成分分析;TOPSIS法;门诊环境卫生监测
数理医药学杂志990248
摘要 应用主成分分析法和TOPSIS法对影响医院候诊室卫生状况的8项指标进行了分析。结果表明,风速、CO2、噪声是决定第一主成分的主要指标,尘埃颗粒数是决定第二主成分的主要指标,CO是决定第三主成分的主要指标。两种方法的排序结果基本一致,但存在一定差异,为医院门诊环境卫生现状的监测评价提供了方法依据。
对系统进行综合评价的常用方法,文献[1]进行了概括,同时指出TOPSIS法是一种能客观、真实反映实际工作情况,且具有较大应用价值的评价方法。但这些方法都需确定权重系数,易受评价人主观因素的影响。文献[2]介绍的主成分分析法,则不使用权系数,从而提高了评价的客观性和质量。本文在简介主成分分析法的基础上,结合潍坊市6家医院候诊室卫生监测数据,分别用主成分分析和TOPSIS法进行了处理,得出了医院卫生状况排列顺序,并对两种方法的优缺点进行比较。为卫生评价机构根据实际情况和要求,选用合适的多指标评价方法提供了依据。
, 百拇医药
1 主成分分析的原理与方法
1.1 原理
设要进行主成分分析的指标有m个:x1,x2,…,xm,共有n例样品,观测数据见表1。
对各指标按式(1)进行变换,将各样品指标值xj转换成标准化指标xj,即 (i=1,2,…,n) (1)
其中j和Sj分别为xj的均数和标准差。x'j的均数为0,方差为1。
表1 m个指标n例的观测值 样品
, 百拇医药
指 标
x1
x2……
xm
1
x11
x12……
x1m
2
x21
x22……
, 百拇医药
x2m
…
…
…
…
…
n
xn1
xn2……
xnm
主成分分析的目的是用较少的综合指标Zi(i=1,2,…,p,p≤m)反映m个原指标xj(j=1,2,…,m)所包含的信息,实际就是建立用标准化指标xj表示的综合指标Zi的方程:
, 百拇医药
其中Z1,Z2,…,Zp分别称为第一主成分,第二主成分,…,第p主成分。Z1包含原有指标的总信息最多,即方差最大,且与其它的Zi(i=2,3,…,p)无关;Z2是除Z1外的方差最大者,且与其它Zi(i=1,3,…,p)无关;其余类推。
1.2 方法
1.2.1 利用(1)式求表1中所有指标值xj的标准化指标xj,其中j和Sj分别为xj的均数和标准差。xj的均数为0,方差为1。
1.2.2 求各标化指标xj的两两相关系数rij,并写出相关系数矩阵R
, 百拇医药
R=rijm×m
1.2.3 求相关矩阵R的特征根λi(i=1,2,…,m),将其由大到小排列:
λ1≥λ2≥λ3≥…≥λm≥0
称 (3)
为第i个主成分Zi的贡献率。(4)
为前p个主成分Z1,Z2,…,Zp的累计贡献率。
, 百拇医药
按预定的累计贡献率,确定主成分个数p(p≤m),求出λi(i=1,2,…,p)对应的贡献率、累计贡献率和特征向量。
1.2.4 求各主成分Zi与标准化指标xj对应的系数关系。
1.2.5 以Z1,Z2,…,Zp分别表示各例样品在p个主成分的得分,Z表示各样品综合得分,按
Z=α1Z1+α2Z2+…+αpZp (5)
计算各样品综合得分,并排列名次。
2 实例分析
, 百拇医药
2.1 资料来源
本资料来源于潍坊市奎文区卫生防疫站1997年公共场所卫生监测记录档案,监测标准执行卫生部颁布的《医院候诊室卫生标准》(GB9671-1996)[3]。监测数据见表2。
表2 6家医院8项原始监测指标数据及正向化值 医院号
指 标
风速
(m/s)
x1
CO2
(%)
x2
, 百拇医药
CO
(mg/m3)
x3
甲醛
(mg/m3)
x4
吸入颗粒
(mg/m3)
x5
空气细菌数
(cfu/皿)
, 百拇医药
x6
噪声
(dB(A))
x7
照度
(Lx)
x8
1
0.41
(2.439
0.08
12.500
, 百拇医药
4.4
0.227
0.09
11.111
0.11
9.091
38
0.026
46
0.022
71
0.014)
2
, 百拇医药
0.38
(2.632
0.09
11.111
4.6
0.217
0.10
10.000
0.13
7.692
37
0.027
41
, 百拇医药
0.024
63
0.016)
3
0.52
(1.923
0.06
16.667
4.3
0.233
0.08
12.500
0.13
, 百拇医药
70692
33
0.030
54
0.019
79
0.013)
4
0.49
(2.401
0.08
12.500
4.8
, 百拇医药
0.208
0.09
11.111
0.15
6.667
36
0.028
50
0.020
68
0.015)
5
0.46
, 百拇医药
(2.174
0.07
14.286
4.2
0.238
0.08
12.500
0.12
8.333
38
0.026
44
0.023
, 百拇医药
57
0.018)
6
0.44
(2.273
0.07
14.286
4.8
0.208
0.07
14.286
0.11
9.091
, 百拇医药
37
0.027
48
0.021
64
0.016)
注:括号内数据为其上对应数据采用倒数变换得到的指标值。照度指标括号内数据为逆向值。
2.2 主成分分析结果
全部数据使用华西医科大学卫生统计教研室1996年编制的统计分析软件包处理,所用微机为联想486。
累计贡献率取88%。
原始指标数据的标准化指标值见表3。表3 标准化指标值 医院号
, 百拇医药
指 标
风速
(m/s)
x1
CO2
(%)
x2
CO
(mg/m3)
x3
甲醛
(mg/m3)
, 百拇医药
x4
吸入颗粒
(mg/m3)
x5
空气细菌数
(cfu/皿)
x6
噪声
(dB(A))
x7
照度
(Lx)
, 百拇医药
x8
1
0.541
-0.543
0.385
-0.537
1.062
-6.64×10-4
2.67×10-4
0.529
2
1.332
, http://www.100md.com
-1.257
-0.385
-1.278
-0.428
0
1.34×10-3
-0.529
3
-1.574
1.597
0.846
0.388
, 百拇医药
-0.428
1.99×10-3
-1.34×10-3
1.587
4
0.385
-0.543
-1.077
-0.537
-1.520
6.64×10-4
-8.02×10-4
, 百拇医药
0.132
5
-0.545
0.374
1.231
0.388
0.255
-6.64×10-4
8.02×10-4
-0.132
6
-0.139
, http://www.100md.com
0.374
-1.077
1.578
1.062
0
-2.67×10-4
-0.397
求得的特征根、贡献率、累计贡献率见表4。表4 特征根、贡献率、累计贡献率 医院号
特征根
贡献率(%)
累计贡献率(%)
, 百拇医药 1
3.9772
49.7147
49.7147
2
2.0854
26.0680
75.7827
3
1.1324
14.1549
89.9376
4
, http://www.100md.com
0.6550
8.1870
98.1247
5
0.1500
1.8753
100
6
0.0000
0.0000
100
7
0.0000
, 百拇医药
0.0000
100
8
0.0000
0.0000
100
根据预定累计贡献率88%,取前3个主成分。
主成分Zi与各标准化指标xj间的系数关系见表5。表5 主成分与标化指标的系数关系
医院号
Z1
Z2
, 百拇医药
Z3
x1
0.9192
-0.3177
0.1424
x2
-0.9275
0.3471
-0.0573
x3
-0.2748
0.4642
, http://www.100md.com
-0.8402
x4
-0.5400
0.6338
0.5321
x5
0.1157
0.8314
0.1703
x6
-0.8041
-0.5279
, 百拇医药
-0.0256
x7
0.8721
0.3104
-0.2797
x8
-0.6960
-0.4313
-0.1091
根据主成分的排队方法,按(5)式计算Z值排名次,见表6。表6 各医院综合得分名次
医院号
, 百拇医药
Z1
Z2
Z3
Z值
名次
1
0.951
0.135
-0.378
0.4545
2
2
, 百拇医药
3.506
-1.975
-0.110
1.2126
1
3
-4.521
0.651
-0.883
-2.2029
6
4
1.145
, http://www.100md.com
-2.472
0.432
-1.4000
5
5
-0.445
1.903
-0.740
0.1701
4
6
-0.632
1.728
, 百拇医药
1.928
0.4092
3
从表5可见,第一主成分Z1主要由指标x1,x2,x7即风速、CO2、噪声决定,第二主成分Z2主要由指标x5即吸入颗粒数决定,第三主成分Z3则主要受指标x3即CO含量的影响。分析表6可知,2号医院的综合评价评价值最高,候诊室环境卫生状况最好,但空气中尘埃颗粒相对较多。
2.3 TOPSIS分析结果
因表2中数据低优指标占多数,为进行TOPSIS分析,在指标同趋势化时,易把高优指标照度利用倒数变换转换为低优指标。
, 百拇医药
最优值向量Z+和最劣值向量Z-分别为:
Z+=(0.3430,0.3261,0.3882,0.3349,0.3571,0.3687,0.3523,0.3439)
Z-=(0.4693,0.4891,0.4333,0.4785,0.4780,0.4246,0.4640,0.4762)
按文献[4]得出各指标的权重系数为:
W=(0.23,0.09,0.15,0.06,0.11,0.13,0.20,0.03)
各医院指标值与最优值、最劣值的距离d+、d-及与最优值的相对接近程度C值,排序结果见表7。表7 d+、d-、C值、排序 医院号
, 百拇医药
d+
d-
C
排序结果
1
0.0172
0.0314
0.6461
2
2
0.0199
0.0375
0.6533
, http://www.100md.com
1
3
0.0374
0.0203
0.3518
5
4
0.0341
0.0115
0.2522
6
5
0.0204
, http://www.100md.com
0.0276
0.5750
4
6
0.0203
0.0276
0.5762
3
两种方法排序结果表明,前四名顺序一致,但第五、第六位次相逆。
3 讨论
一个评价体系的优劣,第一要看该评价方法是否能反映全部指标(变量)的真实情况。主成分分析虽在一定条件下减少了变量个数,但它是通过变量变换利用指标间的相关关系,得到综合性的新指标,可以说没有损失原指标的信息。TOPSIS法在计算过程中没有减少变量个数,所以在这一方面,两种方法都不失为好的评价体系。第二要看评价过程中主观成分占的比例。主成分分析因不使用权重这一人为因素,所以笔者认为,对相同的资料,用主成分分析处理的结果要比用TOPSIS处理可信度高,与实际情况符合的程度要好。第三看评价结果反映问题的多少。主成分分析既可以得出反映原系统质量的新的并具有实际意义的主成分,又可以反映出决定每一主成分的主要指标,还可以对各参评系统的综合情况进行排序,而TOPSIS法反映的问题相比较要少,因此,主成分分析在这一点上也有优越之处。第四要比较每种方法计算过程的简繁,从两种方法看,主成分分析的计算量要大于TOPSIS,但如果运用统计软件进行处理,两种方法几乎无计算的差别。最后需要说明的是,在实际应用中如何选用评价方法,要对各方法的使用条件和评价的目的要求综合考虑,以达到最佳的评价效果。
参考文献
1 黄海林.TOPSIS决策分析及其计算机软件设计.数理医药学杂志,1997,10(1):47.
2 陈景武.苏颀龄.卫生管理多因素分析.济南:山东大学出版社,1993,164.
3 山东省卫生防疫站.公共场所卫生标准.1997,27.
4 夏绍玮,等.系统工程概念.北京:清华大学出版社,1985,56.
收稿日期:1998-12-23, http://www.100md.com
单位:山东潍坊医学院基础部 潍坊261042
关键词:主成分分析;TOPSIS法;门诊环境卫生监测
数理医药学杂志990248
摘要 应用主成分分析法和TOPSIS法对影响医院候诊室卫生状况的8项指标进行了分析。结果表明,风速、CO2、噪声是决定第一主成分的主要指标,尘埃颗粒数是决定第二主成分的主要指标,CO是决定第三主成分的主要指标。两种方法的排序结果基本一致,但存在一定差异,为医院门诊环境卫生现状的监测评价提供了方法依据。
对系统进行综合评价的常用方法,文献[1]进行了概括,同时指出TOPSIS法是一种能客观、真实反映实际工作情况,且具有较大应用价值的评价方法。但这些方法都需确定权重系数,易受评价人主观因素的影响。文献[2]介绍的主成分分析法,则不使用权系数,从而提高了评价的客观性和质量。本文在简介主成分分析法的基础上,结合潍坊市6家医院候诊室卫生监测数据,分别用主成分分析和TOPSIS法进行了处理,得出了医院卫生状况排列顺序,并对两种方法的优缺点进行比较。为卫生评价机构根据实际情况和要求,选用合适的多指标评价方法提供了依据。
, 百拇医药
1 主成分分析的原理与方法
1.1 原理
设要进行主成分分析的指标有m个:x1,x2,…,xm,共有n例样品,观测数据见表1。
对各指标按式(1)进行变换,将各样品指标值xj转换成标准化指标xj,即 (i=1,2,…,n) (1)
其中j和Sj分别为xj的均数和标准差。x'j的均数为0,方差为1。
表1 m个指标n例的观测值 样品
, 百拇医药
指 标
x1
x2……
xm
1
x11
x12……
x1m
2
x21
x22……
, 百拇医药
x2m
…
…
…
…
…
n
xn1
xn2……
xnm
主成分分析的目的是用较少的综合指标Zi(i=1,2,…,p,p≤m)反映m个原指标xj(j=1,2,…,m)所包含的信息,实际就是建立用标准化指标xj表示的综合指标Zi的方程:
, 百拇医药
其中Z1,Z2,…,Zp分别称为第一主成分,第二主成分,…,第p主成分。Z1包含原有指标的总信息最多,即方差最大,且与其它的Zi(i=2,3,…,p)无关;Z2是除Z1外的方差最大者,且与其它Zi(i=1,3,…,p)无关;其余类推。
1.2 方法
1.2.1 利用(1)式求表1中所有指标值xj的标准化指标xj,其中j和Sj分别为xj的均数和标准差。xj的均数为0,方差为1。
1.2.2 求各标化指标xj的两两相关系数rij,并写出相关系数矩阵R
, 百拇医药
R=rijm×m
1.2.3 求相关矩阵R的特征根λi(i=1,2,…,m),将其由大到小排列:
λ1≥λ2≥λ3≥…≥λm≥0
称 (3)
为第i个主成分Zi的贡献率。(4)
为前p个主成分Z1,Z2,…,Zp的累计贡献率。
, 百拇医药
按预定的累计贡献率,确定主成分个数p(p≤m),求出λi(i=1,2,…,p)对应的贡献率、累计贡献率和特征向量。
1.2.4 求各主成分Zi与标准化指标xj对应的系数关系。
1.2.5 以Z1,Z2,…,Zp分别表示各例样品在p个主成分的得分,Z表示各样品综合得分,按
Z=α1Z1+α2Z2+…+αpZp (5)
计算各样品综合得分,并排列名次。
2 实例分析
, 百拇医药
2.1 资料来源
本资料来源于潍坊市奎文区卫生防疫站1997年公共场所卫生监测记录档案,监测标准执行卫生部颁布的《医院候诊室卫生标准》(GB9671-1996)[3]。监测数据见表2。
表2 6家医院8项原始监测指标数据及正向化值 医院号
指 标
风速
(m/s)
x1
CO2
(%)
x2
, 百拇医药
CO
(mg/m3)
x3
甲醛
(mg/m3)
x4
吸入颗粒
(mg/m3)
x5
空气细菌数
(cfu/皿)
, 百拇医药
x6
噪声
(dB(A))
x7
照度
(Lx)
x8
1
0.41
(2.439
0.08
12.500
, 百拇医药
4.4
0.227
0.09
11.111
0.11
9.091
38
0.026
46
0.022
71
0.014)
2
, 百拇医药
0.38
(2.632
0.09
11.111
4.6
0.217
0.10
10.000
0.13
7.692
37
0.027
41
, 百拇医药
0.024
63
0.016)
3
0.52
(1.923
0.06
16.667
4.3
0.233
0.08
12.500
0.13
, 百拇医药
70692
33
0.030
54
0.019
79
0.013)
4
0.49
(2.401
0.08
12.500
4.8
, 百拇医药
0.208
0.09
11.111
0.15
6.667
36
0.028
50
0.020
68
0.015)
5
0.46
, 百拇医药
(2.174
0.07
14.286
4.2
0.238
0.08
12.500
0.12
8.333
38
0.026
44
0.023
, 百拇医药
57
0.018)
6
0.44
(2.273
0.07
14.286
4.8
0.208
0.07
14.286
0.11
9.091
, 百拇医药
37
0.027
48
0.021
64
0.016)
注:括号内数据为其上对应数据采用倒数变换得到的指标值。照度指标括号内数据为逆向值。
2.2 主成分分析结果
全部数据使用华西医科大学卫生统计教研室1996年编制的统计分析软件包处理,所用微机为联想486。
累计贡献率取88%。
原始指标数据的标准化指标值见表3。表3 标准化指标值 医院号
, 百拇医药
指 标
风速
(m/s)
x1
CO2
(%)
x2
CO
(mg/m3)
x3
甲醛
(mg/m3)
, 百拇医药
x4
吸入颗粒
(mg/m3)
x5
空气细菌数
(cfu/皿)
x6
噪声
(dB(A))
x7
照度
(Lx)
, 百拇医药
x8
1
0.541
-0.543
0.385
-0.537
1.062
-6.64×10-4
2.67×10-4
0.529
2
1.332
, http://www.100md.com
-1.257
-0.385
-1.278
-0.428
0
1.34×10-3
-0.529
3
-1.574
1.597
0.846
0.388
, 百拇医药
-0.428
1.99×10-3
-1.34×10-3
1.587
4
0.385
-0.543
-1.077
-0.537
-1.520
6.64×10-4
-8.02×10-4
, 百拇医药
0.132
5
-0.545
0.374
1.231
0.388
0.255
-6.64×10-4
8.02×10-4
-0.132
6
-0.139
, http://www.100md.com
0.374
-1.077
1.578
1.062
0
-2.67×10-4
-0.397
求得的特征根、贡献率、累计贡献率见表4。表4 特征根、贡献率、累计贡献率 医院号
特征根
贡献率(%)
累计贡献率(%)
, 百拇医药 1
3.9772
49.7147
49.7147
2
2.0854
26.0680
75.7827
3
1.1324
14.1549
89.9376
4
, http://www.100md.com
0.6550
8.1870
98.1247
5
0.1500
1.8753
100
6
0.0000
0.0000
100
7
0.0000
, 百拇医药
0.0000
100
8
0.0000
0.0000
100
根据预定累计贡献率88%,取前3个主成分。
主成分Zi与各标准化指标xj间的系数关系见表5。表5 主成分与标化指标的系数关系
医院号
Z1
Z2
, 百拇医药
Z3
x1
0.9192
-0.3177
0.1424
x2
-0.9275
0.3471
-0.0573
x3
-0.2748
0.4642
, http://www.100md.com
-0.8402
x4
-0.5400
0.6338
0.5321
x5
0.1157
0.8314
0.1703
x6
-0.8041
-0.5279
, 百拇医药
-0.0256
x7
0.8721
0.3104
-0.2797
x8
-0.6960
-0.4313
-0.1091
根据主成分的排队方法,按(5)式计算Z值排名次,见表6。表6 各医院综合得分名次
医院号
, 百拇医药
Z1
Z2
Z3
Z值
名次
1
0.951
0.135
-0.378
0.4545
2
2
, 百拇医药
3.506
-1.975
-0.110
1.2126
1
3
-4.521
0.651
-0.883
-2.2029
6
4
1.145
, http://www.100md.com
-2.472
0.432
-1.4000
5
5
-0.445
1.903
-0.740
0.1701
4
6
-0.632
1.728
, 百拇医药
1.928
0.4092
3
从表5可见,第一主成分Z1主要由指标x1,x2,x7即风速、CO2、噪声决定,第二主成分Z2主要由指标x5即吸入颗粒数决定,第三主成分Z3则主要受指标x3即CO含量的影响。分析表6可知,2号医院的综合评价评价值最高,候诊室环境卫生状况最好,但空气中尘埃颗粒相对较多。
2.3 TOPSIS分析结果
因表2中数据低优指标占多数,为进行TOPSIS分析,在指标同趋势化时,易把高优指标照度利用倒数变换转换为低优指标。
, 百拇医药
最优值向量Z+和最劣值向量Z-分别为:
Z+=(0.3430,0.3261,0.3882,0.3349,0.3571,0.3687,0.3523,0.3439)
Z-=(0.4693,0.4891,0.4333,0.4785,0.4780,0.4246,0.4640,0.4762)
按文献[4]得出各指标的权重系数为:
W=(0.23,0.09,0.15,0.06,0.11,0.13,0.20,0.03)
各医院指标值与最优值、最劣值的距离d+、d-及与最优值的相对接近程度C值,排序结果见表7。表7 d+、d-、C值、排序 医院号
, 百拇医药
d+
d-
C
排序结果
1
0.0172
0.0314
0.6461
2
2
0.0199
0.0375
0.6533
, http://www.100md.com
1
3
0.0374
0.0203
0.3518
5
4
0.0341
0.0115
0.2522
6
5
0.0204
, http://www.100md.com
0.0276
0.5750
4
6
0.0203
0.0276
0.5762
3
两种方法排序结果表明,前四名顺序一致,但第五、第六位次相逆。
3 讨论
一个评价体系的优劣,第一要看该评价方法是否能反映全部指标(变量)的真实情况。主成分分析虽在一定条件下减少了变量个数,但它是通过变量变换利用指标间的相关关系,得到综合性的新指标,可以说没有损失原指标的信息。TOPSIS法在计算过程中没有减少变量个数,所以在这一方面,两种方法都不失为好的评价体系。第二要看评价过程中主观成分占的比例。主成分分析因不使用权重这一人为因素,所以笔者认为,对相同的资料,用主成分分析处理的结果要比用TOPSIS处理可信度高,与实际情况符合的程度要好。第三看评价结果反映问题的多少。主成分分析既可以得出反映原系统质量的新的并具有实际意义的主成分,又可以反映出决定每一主成分的主要指标,还可以对各参评系统的综合情况进行排序,而TOPSIS法反映的问题相比较要少,因此,主成分分析在这一点上也有优越之处。第四要比较每种方法计算过程的简繁,从两种方法看,主成分分析的计算量要大于TOPSIS,但如果运用统计软件进行处理,两种方法几乎无计算的差别。最后需要说明的是,在实际应用中如何选用评价方法,要对各方法的使用条件和评价的目的要求综合考虑,以达到最佳的评价效果。
参考文献
1 黄海林.TOPSIS决策分析及其计算机软件设计.数理医药学杂志,1997,10(1):47.
2 陈景武.苏颀龄.卫生管理多因素分析.济南:山东大学出版社,1993,164.
3 山东省卫生防疫站.公共场所卫生标准.1997,27.
4 夏绍玮,等.系统工程概念.北京:清华大学出版社,1985,56.
收稿日期:1998-12-23, http://www.100md.com