当前位置: 首页 > 期刊 > 《中国临床心理学杂志》 > 2000年第1期
编号:10270934
一般行政能力倾向测验的建构及信度、效度研究
http://www.100md.com 《中国临床心理学杂志》 2000年第1期
     作者:洪炜 龚耀先

    单位:洪炜(北京医科大学医学心理学教研室,北京,100871);龚耀先(湖南医科大学附二院医学心理中心,长沙,410011)

    关键词:能力倾向测验;信度;效度

    中国临床心理学杂志000101 摘 要:目的:为省、地(市)级公务员录用考试编制“一般行政能力倾向测验”(简称GAAT)。方法:通过工作分析等方法确定GAAT的内容和结构,经实际使用后进行结构及内容分析,并作信度和效度检验。结果:测验总体难度为0.538,试题的区分度>0.2;各分量表间存在中、低度相关(0.2143~0.4909),与总分的相关较高(0.5858~0.8326);按分量表进行因素分析得两个特征值>1的因素,按分测验进行因素分析得四个特征值>1的因素。GAAT的α系数为0.932,分量表为0.882~0.935;间隔一个月的重测相关为0.836。被试在GAAT的总分和一些分量表中存在着年龄、性别及学历间的差异,但分值差异不大(1~6分);GAAT的总分及分测验与长—鞍团体智力测验的总IQ及三个因素间明显相关;经考试录用的公务员的工作业绩及实际能力优于非考试录用者。结论:GAAT包含了公务员基本能力倾向的测量内容;量表的结构合理,内部一致性及稳定性较好,达到了心理测量学的基本要求;以有关的内容和测验等作效标证明了GAAT的有效性。
, http://www.100md.com
    分类号:B841.7 文献标识码:A

    文章编号:1005-3611(2000)01-0001-06

    The Construction of the General Administrative Aptitude Test (GAAT) and

    Its Reliability and Validity

    HONG Wei GONG Yaoxian

    (Beijing Medical University, Beijing)

    Abstract:Objective:To construct the General Administrative Aptitude Test (GAAT) for the government functionary. Methods:The content and structure of the GAAT were established by the method of work analysis, and use of the GAAT in actual entrance examinations. Reliability and validity of the GAAT were examined by test-retest, group comparison, correlation and factor analyses. Results:The overall difficulty of the test was 0.538, the discrimination of all items was over 0.20. There were middle or lower coefficients of correlation between the subscale scores (0.2143~0.4909), but the coefficients of correlation between the subscales and the overall scores were higher(0.5858~0.8326). There were two main factors revealed by factors analysis of the subscales, and four main factors by factor analysis of subtests. The homogeneity reliability of GAAT was 0.932; correlation of retesting after one month was 0.836. There were some discrepancies with respect to age, sex, and education level, but the scores of GAAT on the discrepancies were not very high (1-6). There was obvious correlation between the GAAT and CAITG. Comparison of the two government functionaries' groups on their manifest work and actual abilities showed that the first group that had an entrance examination had higher working quantity and quality, mastery in knowledge and cognizing ability. Conclusion:The structure of the GAAT is reasonable, and its reliability and validity meet the need of psychometrics.
, 百拇医药
    Key words:Aptitude test, Reliability, Validity▲

    能力倾向(aptitude)也称性向,是指经过适当训练或被置于适当的环境下完成某种任务的可能性[1-2]。一般行政能力倾向(general administrative aptitude)是能力倾向的一种,它是指经过适当学习、训练或置于一定的环境条件下,能完成行政职业领域内的一般活动的可能性或潜力[3]。无疑,它在保障公务员有效、顺利地履行某职能具有重要作用。

    我们于1995年受人事部人事考试中心委托编制“一般行政能力倾向测验”(General Administrative Aptitude Test, 简称GAAT),目的是为省、地(市)级公务员录用考试而用。我们所采取的测验编制策略也主要是通过工作分析的方法,以目前我国行政职业的实际工作中所需要的能力为基础,结合能力倾向的理论并参考了国内、外有关的能力倾向测验的内容,确定了所采用的GAAT的内容和结构。本研究为以此方法设计的GAAT在部分省、地进行实际使用后所做的结构及内容分析,以及相应的信度和效度检验的初步总结。以期为进一步制定正式的GAAT版本、建立常模和题库建设提供依据。
, 百拇医药
    1 研究方法

    1.1 量表的编制

    1.1.1 条目库的建立 通过对行政人员能力的调查研究并从文献资料中收集条目,同时采用了请专业人员论证和工作分析的方法。通过对心理测量学家、管理心理学家、省、地(市)人事部门的有关人员及用人单位的领导进行咨询,得到较为一致的意见,即对于省、地(市)级公务员的选拔和实际工作来说,言语的理解和表达能力、分析推理和判断能力、数量关系的把握及运算、对数据的分析和理解等能力都是十分重要的。

    1.1.2 确定量表的结构和内容 通过以上工作和分析,制定出了GAAT的结构和编制计划,大体上确定了GAAT包含四个基本组成部分(分量表):数量关系、言语理解、判断推理和资料分析。题型的设置考虑到测验的可靠性而采用了多选择性试题;考虑到GAAT是一个团体测验,一次测量的样本较大而采用(计算)机读问卷;注意到受试者的可接受性和为降低其测验紧张,需要在组织命题和审题过程中加强了试题的表面效度;此外,在设置题型过程中,还注重了对语言运用准确性的考察(重点放在用词准确性、语句表达规范性和对段落的理解上)以及从多角度考察推理能力。最后确定GAAT共含10种题型(分测验):数字推理、数学运算、选词填空、语句表达、言语理解、事件排序、常识判断、图形推理、演绎推理和资料分析。
, 百拇医药
    1.1.3 编制试测题本 预测题本的编制采用加入铆题的做法,铆题取自在中央级单位进行公务员选拔考试使用过,并经过题目分析被认为是比较可靠和有效的AAT试题。

    1.1.4 预测及量表的建立 预测题本编制出后先后在内蒙古的赤峰市和湖南两地进行了试测(共测得样本数3 240人)。对结果进行统计分析,从题目的难度、区分度及备择选项三个方面对预测题本进行考察,发现全部铆题均达到了测量要求,而新编试题中有部分试题在难度、区分度或备择选项等指标上不够理想,将这些试题淘汰,最后选出符合上述要求的题目100题编制成GAAT的题本。

    1.2 实测样本

    1997年8月湖南省人事考试中心面向社会招考国家公务员的资料,参考人员的GAAT实际有效答卷为3 491份,其中男性2 017份,女性1 474份。考生年龄为24~35岁,平均30.3±3.4岁,录取后将被分配到省直机关19个厅局(委)的下属单位工作。
, 百拇医药
    1998年3月湖南省人事考试中心从应届大学毕业生(含大专生及研究生)招考国家公务员的资料,考生年龄为22~34岁,平均24.2±1.6岁。收到GAAT实际有效答卷753份,其中男性462份,女性291份。

    2 结 果

    2.1 题目分析(备择选题、难度和区分度)

    从表1中可以看出,由于经过预测和题目筛选,题目总体质量较好。测验总体难度为0.538,较好地实现了预期的中等难度,达到了能力倾向测验筛选报考者的目的。需要改进的备择选项占全部备择选项的4%;过难的题目(P<0.2)有5题,占全部试题的5%;过于容易的题目(P>0.8)有3题,占全部试题的3%;全部试题均有较好的区分度(D≥0.2)。

    表1 题目分析汇总(n=3 491)

    题数
, 百拇医药
    难度

    区分度

    数量关系

    15

    0.579

    0.586

    言语理解

    30

    0.582

    0.474

    判断推理

    40

    0.543
, http://www.100md.com
    0.536

    资料分析

    15

    0.412

    0.561

    总 计

    100

    0.538

    0.478

    2.2 试卷分析

    2.2.1 各个分量表之间的相关 各个分量表之间具有中低等程度的相关,最高为 0.491,最低为0.214;而各分量表与总分之间存在着中高等程度的相关,最高为0.833,最低为0.586(表2)。
, http://www.100md.com
    表2 各个部分之间的相关(n=3 491)

    言语理解

    判断推理

    资料分析

    总 分

    言语理解

    0.268

    判断推理

    0.442

    0.376

    资料分析

    0.360

, 百拇医药     0.214

    0.491

    总 分

    0.669

    0.586

    0.833

    0.744

    2.2.2 因素分析的结果 按分量表进行因素分析,得到两个特征值大于1的因素。第一个因素所占方差比例为42.2%,第二个因素所占方差为25.1%。这两个因素决定了总方差的67.3%。按十种题型进行因素分析,得到四个特征值大于1的因素。第一个因素所占方差比例为21.0%,第二个因素所占方差比例为14.09%,第三个因素所占方差比例为12.6%,第四个因素所占方差比例为10.3%。四个因素的累计方差比例为58.8%。经过方差极大旋转的因素负荷矩阵见表3。第一个因素与数字推理、数学运算、语句表达、及资料分析关系密切,第二个因素与事件排序、常识判断关系密切,第三个因素与言语理解及演绎推理关系密切,第四个因素与选词填空和图形推理关系密切。表3 经方差极大旋转的因素负荷矩阵
, http://www.100md.com
    (按题型)(n=3 491)

    因素1

    因素2

    因素3

    因素4

    数字推理

    0.449

    -0.467

    0.271

    -0.004

    数学运算

    0.569

    -0.357
, 百拇医药
    -0.182

    0.181

    选词填空

    0.404

    -0.098

    -0.583

    0.841

    语句表达

    0.570

    -0.057

    0.114

    -0.537

    言语理解
, 百拇医药
    0.449

    0.045

    0.547

    -0.154

    事件排序

    0.315

    0.508

    -0.351

    -0.507

    常识判断

    0.422

    0.617

    -0.102
, 百拇医药
    0.324

    图形推理

    0.343

    0.466

    -0.089

    0.579

    演绎推理

    0.049

    0.484

    0.592

    0.140

    资料分析

    0.697
, 百拇医药
    -0.204

    0.089

    0.258

    2.3 信度检验

    2.3.1 重测信度 通过自愿报名方式选取北医大七个专业在校一、二年级大学生87名进行GAAT及长—鞍团体智力测验的测试。其中男生38名,女生49名;年龄为18~20岁。对其中的38名大学生(其中男性16名,女性22名)在间隔一个月后进行了GAAT重测,其重测相关系数在0.763~0.931之间(表4)。表4 GAAT的信度指标

    实测样本

    的α系数

    (n= 3 491)

    重测相关
, 百拇医药
    (n=38)

    标准测量

    误(SE)

    (n=3 491)

    数量关系

    0.882

    0.874

    1.373

    言语理解

    0.893

    0.763

    2.275

    判断推理
, 百拇医药
    0.935

    0.868

    2.470

    资料分析

    0.892

    0.931

    1.390

    总 分

    0.932

    0.836

    0.376

    2.3.2 内部一致性检验(α系数) 对湖南省1997年报考国家公务员的3 491名考生的GAAT成绩进行分析,GAAT总分的α系数为0.931,各分量表的α系数范围在0.882~0.935之间(表4)。
, 百拇医药
    2.3.3 标准测量误 分量表的标准测量误在1.373~2.470之间,总分的标准测量误为0.376(表4)。

    2.4 效度研究资料

    2.4.1 测验成绩与学历的相关 从湖南省1998年公开招考公务员的资料中得到报考人员的学历及GAAT测验成绩(原始分),对二者之间的关系进行了统计分析,结果发现大专学历组与本科学历组及研究生学历组间在GAAT的各分量表及总分间都存在着显著差异;而本科学历组与研究生学历组在GAAT的这些成绩方面差异不显著。

    2.4.2 性别比较 对不同性别的GAAT成绩(原始分)进行比较,结果发现男女性别在言语理解、判断推理及总分间具有较明显差异;而在数量关系和资料分析方面的差异不显著。

    2.4.3 测验成绩与年龄的相关 将不同年龄的考生(22~34岁)与其GAAT的成绩进行相关分析,得到的结果表明:除言语理解外,考生AAT的成绩与其年龄之间存在较明显的负相关,即年龄小的人得分较高,年龄大的人得分较低。
, 百拇医药
    2.4.4 GAAT与长—鞍团体智力测验之间的相关 对87名在校大学生和41名企业中、高层管理人员(取自深圳某公司,年龄为25~43岁,平均32.7±4.8岁;文化教育除3名为大专毕业外,均为大学本科以上学历;其中男性为24人,女性为17人。)进行GAAT测试并进行长—鞍团体智力测验[4]的测试,对两项测验的结果作相关分析(表5),GAAT总分除与团体智测总IQ间存在较显著的相关外,并与其智力A因素和B因素间也存在一定程度的相关。此外,GAAT的各分测验与长—鞍团体智力测验的三个因子及总IQ间也分别存在着一定程度的相关。其中,资料分析、演绎推理、图形推理和事件排序等与A因素,言语理解、语词填空、常识判断和数学运算等与B因素,数字推理与C因素(注意/记忆因素)以及资料分析、数字推理、数学运算、演绎推理、语句表达和事件排序等与总IQ都存在较为明显的相关。表5 GAAT与长—鞍团体智力测验

    之间的相关(n=128)

    总IQ
, 百拇医药
    A因素

    B因素

    C因素

    数字推理

    0.374**

    0.193

    0.259*

    0.341**

    数学运算

    0.337**

    0.282*
, http://www.100md.com
    0.328**

    0.035

    语词填空

    0.142

    0.101

    0.181*

    0.097

    语句表达

    0.207*

    0.191

    0.104

    0.191
, 百拇医药
    言语理解

    0.051

    -0.081

    0.285*

    0.020

    事件排序

    0.200*

    0.223*

    0.112

    0.079

    常识判断

    0.177
, 百拇医药
    0.126

    0.268*

    -0.240*

    图形推理

    0.181

    0.206*

    0.086

    0.067

    演绎推理

    0.239*

    0.216*
, 百拇医药
    0.173

    0.022

    资料分析

    0.393**

    0.314**

    0.344**

    0.085

    AAT总分

    0.364**

    0.238*

    0.247*
, 百拇医药
    0.134

    注:* P<0.05; ** P<0.01

    2.4.5 对已招录公务员的工作业绩及实际能力的评估 本研究对湖南省五个厅(委)经1996年公开考试(含GAAT测试)已招录的34名公务员和非经考试招录的29名公务员由所在单位领导和同事作综合评估。在被评估的14项内容中,工作质量、工作效度、与工作相关的基础和专业知识、灵活性、理解能力和逻辑性等七项内容考录组优于对照组(非考录组),经t检验两组的差别有高度显著性;而在技能、严谨性和判断力三项内容中,对照组优于考录组,经t检验两组的差别也有高度显著性;其余的四项内容,两组的差异不显著(表6)。

    表6 对两组公务员的工作业绩及

    实际能力的评估比较

    考录组
, 百拇医药
    (n=34)

    对照组

    (n=29)

    P值

    工作质量

    1.14±0.66**

    2.23±0.13

    <0.01

    工作数量

    2.01±0.55

    2.13±0.26

    >0.05
, 百拇医药
    工作效率

    1.64±0.14**

    2.45±0.36

    <0.01

    基础知识

    1.43±0.51**

    2.01±0.44

    <0.01

    专业知识

    1.29±0.83**

    2.01±0.36
, http://www.100md.com
    <0.01

    技 能

    2.54±0.66

    1.74±0.63**

    <0.01

    灵 活 性

    1.64±0.75**

    2.17±0.26

    <0.01

    理解能力

    2.02±0.39**
, http://www.100md.com
    2.71±0.57

    <0.01

    严 谨 性

    2.29±0.47

    1.36±0.59**

    <0.01

    逻 辑 性

    1.51±0.52**

    1.99±0.31

    <0.01

    表达能力

    2.21±0.43
, 百拇医药
    2.09±1.43

    >0.05

    想 象 力

    1.93±1.23

    2.35±0.86

    >0.05

    判 断 力

    2.29±0.47

    1.86±0.77*

    <0.05

    协调能力

    2.14±0.38
, 百拇医药
    1.95±0.48

    >0.05

    3 讨 论3.1 GAAT的建构及测量学特征

    GAAT实施的目的是要考察受试者是否具有从事行政职业工作所需要的那些比较稳定、持久的能力。按照Vernon等人的观点,能力可分为不同的层次结构,处于最顶层的一级能力即智力,它又可派生出次级因素群,进一步衍生出小因素群和各种独立的特殊因素[6]。与公务员行政职业工作有关的能力变量很多,作为选拔公务员的一般行政能力倾向测验,考虑到实际工作中所需要的一些基本能力和在考试中的可操作性,确定了GAAT的四个基本组成部分及它们所含的10个分测验。从测量学的角度看,GAAT各分量表之间存在着中低等程度的相关,说明GAAT测量了不同方面的能力倾向;而各分量表与总分之间的相关较高,说明测验的内部一致性较好,结构比较合理。从在一些省、地(市)公务员录用考试的应用结果和对经考试已录用的公务员的考察来看,GAAT的整体试卷和各组成部分均具有适当的难度和较好的区分度,其成绩良好的考生经录用后在实际工作中表现出了较好的能力素质,基本上达到了GAAT的设计要求。
, http://www.100md.com
    3.2 GAAT的信度问题

    本研究从三个方面考察了测验的信度:内部一致性、标准测量误和重测信度。由于GAAT每个分量表的题目数相对较少,不宜作分半相关检验,而采用计算α系数的方法进行信度检验。结果显示GAAT具有比较满意的内部一致性。对一个3000多人的实测样本进行分析,GAAT四个分量表的α系数均达到0.88以上,总分的α系数达到0.932;四个分量表的标准测量误为1.373~2.470,总分为0.376,此结果达到或优于一般能力倾向测验所要求的信度指标[7]。在经过间隔30天的时间对一个小样本进行GAAT重测,对两次测验的结果作相关分析表明:GAAT的四个分量表的重测相关系数为0.763~0.931,总分的重测相关系数达0.836,符合心理测量学对能力倾向测验的基本要求[8]

    3.3 GAAT的效度问题

    对四个分量表进行因素分析得到了两个特征值大于1的因素,这两个因素可以分别被理解为与数字及语义有关的因素和逻辑推理有关的因素。对十种题型进行因素分析得到了四个特征值大于1的因素,这四个因素可以分别被理解为与数字及符号有关的因素、与知识广度及运用有关的因素、与逻辑推理有关的因素和与空间关系等有关的因素。需要指出的是,这四个因素虽然基本符合了量表编制时的理论构想,即以考查被试的逻辑推理能力、对数量关系的把握、及知识广度等为重要,但目前的量表结构形式与因子内容的实际分布还存在着较大差异,特别是言语理解的三种题型分属于不同的因子。尽管从表面形式上可将它们归为一个分量表,但从内在的关系上看则需要作一定的调整和修改,并作进一步深入的研究。
, 百拇医药
    关于能力与年龄、性别及教育的关系已有许多研究。虽然不同的理论模型及研究结果的结论不尽相同,但一般认为,一般能力(智力)在20岁组达到最高水平,以后呈总体下降趋势。但对于不同方面的能力,其随年龄变化的趋势又不尽相同[9-10]。本研究的对象为22~34岁的考生,GAAT的结果表明考生成绩除言语理解外均与其年龄呈负相关,即总体年纪越轻成绩越好。这一结果与Cattell及Horn所提出的流体—晶体智力的理论观点基本一致[10]。作为一个测验在实施时需要考虑的一个重要问题是公平性,即对不同背景的考生不带有偏向性。这一点在GAAT的题目编制时已有考虑,并在组卷时有所取舍。不过,“绝对公平”的概念只是理想,对于GAAT来说也是这样。不同性别和不同教育背景的人在能力方面也有所差别,这在许多研究中已有证明[11-12]。本研究的结果也表明:除年龄外,不同性别、不同教育背景的考生其GAAT的结果也存在差异。这从一个方面印证了GAAT的有效性。另一方面,从测验结果来看,尽管年龄、性别和学历对GAAT的结果有一定影响,但这种差异只是统计学意义上的,从实际分值上看,不同群组的差异有时只是一、两分之差,这在实际录用时还要综合考虑其它成绩和其它因素,因此不能认为GAAT带有偏向性。
, 百拇医药
    能力倾向性既不同于智力,也不同于成就,但三者之间存在着密切联系[1,13]。以智力测验作为效标对能力倾向测验进行效度检验是从相邻的方面对能力倾向性所作的考察,在对能力倾向性的研究中也是常用的方法[12,14]。在本研究中GAAT与长—鞍团体智力测验的总IQ及三个因子间存在着较明显相关,GAAT的各分测验与智力测验的不同因子间也存在着相应的联系,说明GAAT所测量的内容中包含了基本的能力因素以及能力的不同侧面。

    能力倾向测验的一个重要机能是其预测机能,即推测受试者在将要从事的活动中成功和适应的可能性有多大[1,15]。因此对GAAT的效度检验的一个重要方面是对经考试录用的公务员的工作业绩和实际工作能力的考核,可作为GAAT的一个预测效度。本研究对经公开招考录用的部分公务员进行了调研评估,这些公务员所在单位的领导及同事对他(她)们的评价普遍良好。经用有关的工作业绩和实际能力评估量表评估,所得到的结果表明他(她)们具有较好的基础和专业知识水平,在理解力、逻辑性、灵活性等方面具有较强优势,在工作质量和工作效率方面的表现也较为出色。这一结果与测验编制的构想基本一致,达到了一定的预测目的。需要说明的是,对照评估的结果表明经其它途径选录的公务员在技能、严谨性和判断力等方面也具有较强优势,这一结果并未否定GAAT的预测作用。因为经其它途径录用的公务员均为1996年以前入到政府机关工作岗位,他(她)们有更好的工作经验,因此在技能、判断能力等方面可表现出更大优势。此外,象严谨性等内容在工作表现中也是十分重要的,不过,这些内容不是能力倾向测验所要评估的重点,但也提示在公务员的考试、选择和录用中,需要将这些内容考虑进去。■
, http://www.100md.com
    基金项目:本研究受国家人事部人事考试中心委托并得到项目资助.

    参考文献:

    [1] Anastasi A. Psychological Testing (6th ed). New York:Macmillan Publishing Co., 1988

    [2] 彭凯平.心理测验—原理与应用.北京:华夏出版社,1989

    [3] 刘嘉林等.国家公务员考试录用教程.北京:中国商业出版社,1995.277,417-495

    [4] 龚耀先等.长—鞍团体智力测验手册.长沙:湖南医科大学,1997

    [5] 彭剑峰,包 政.现代管理制度、程序、方法—人事考核卷.北京:中国人民大学出版社,1993.422-440
, http://www.100md.com
    [6] Vernon PE. The structure of human abilities (rev.ed). London:Methuen, 1971

    [7] U.S.Department of Labor, Manual for the USES General Aptitude Test Battery. Washington:U.S.Government Printing Office, 1981

    [8] Hopkins KD. Educational and Psychological Measurement and Evaluation, Prentice-Hall Inc., 1990.143-164

    [9] 吴振云.成人智力发展与记忆.心理学报,1985,17(3):125-130

    [10] Horn JL. The Theory of Fluid and Crystallized Intelligence in Relation to Concepts of Cognitive Psychology and Aging in Adulthood, Aging and Cognitive Processes, New York:Plenum,1982.237-278
, 百拇医药
    [11] Schaie KW. Intellectual Development in Adulthood. In J.E.Birren & K.W.S.Schaie(Eds), Handbook of the Psychology of Aging, (3rd ed). New York,1990

    [12] 季伟华.能力测量的理论和应用研究.南京:南京师范大学,1992

    [13] Sterberg RJ. The nature of mental abilities. American Psychologist, 1979,34:214-230

    [14] 龚建南.长—鞍团体智力测验长沙市中学生常模的制定.中国临床心理学杂志,1996,4(4):197-201

    [15] Dohm TE. The validity of the Ball Aptitude Bettery. Educational and Psychological Measurement, 1985,45:627-637

    [16] 曹日昌主编.普通心理学.北京:人民教育出版社,1979.184-190

    收稿日期:1999年11月, 百拇医药