以下内容来自【戴晓阳. 常用心理评估量表手册[M]. 人民军医出版社, 2010.】本书有关量表介绍的概述部分,质量和深度一般,因为它重在介绍许多量表。
如想要细致了解心理量表和心理测验,推荐《金瑜.心理测量[M].华东师范大学出版社,2005.】
以下内容由全科之窗编辑精心选择和整理,未经允许,请勿转载!
第1章心理量表概论
一、 心理量表与心理测验
在测量学领域,量表(scales)是用于测量的准尺。
朱智贤主编的《心理学大词典》将量表解释为“一个具有单位和参照点的连续体”,将被测量的事物置于该连续体的适当位置,看它离开参照点多少单位的计数便得到一个测值。
量表在心理与教育测量中专指测验量表。因此,心理量表(psychological scales)与心理测验(psychological tests)的概念是一致的,指用来测量不同心理特征(能力、人格、成就、兴趣等)的工具。
Hopkins KD根据测量的目标将心理测验分为两类:
一类是认知测验(cogni-tive tests),用来评价个体某项作业能力的最高水平(此人“能做什么?做得怎么样?”),例如智力测验、特殊能力测验、成就测验就属于这类测验;
另一类测验是情感测量(affective measures),用于评价个体的典型作业特征(此人“常做些什么?”或“感觉怎么样?”),通常包括评价人格、兴趣等心理特征的测验。态度量表(attitude scales)是情感目标测验中最主要的一类,通常采用纸-笔测验方式,包括自评和他评两种评价方式。前者由被测验者自己对照测验条目的情景根据感受作答;后者则由知情人对照测验条目的情景根据对被测者的了解做出评价,他评方法实际上是从自然观察延伸而来的。
在国内,许多研究者习惯将评价心理卫生、学校和社会行为、价值观点(一般不包括人格测验、兴趣测验)等态度量表统称为评定量表(rating scales),其依据是将英文“rate”的动词不定式翻译成“评定”。但是在心理测量学中“rating scales"特指等级量表,是一种以等级评分方式为特征的心理量表。
二、 心理态度量表的形式
1. 瑟斯顿态度量表(Thurstone attitudescales)
该量表是20世纪30年代瑟斯顿在芝加哥大学做研究时发展的,用于评价被测验者对待某些事情的态度、雇员的道德水平等。它采用7点评分方式,非常赞成某个题目的观点给6分,非常不赞成给0分,中性(两者都不是)则给3分,被测者得分越高,表明越同意题目所示的观点。
瑟斯顿态度量表一般由20-45个项目组成,可以包含几个不同的维度,各维度的项目经过随机排序组成正式量表。许多研究证明这种量表形成是有效的,但其所能测量的因子受到一定限制。
2.
里克特量表(Likert scales)
这是一种最常用的心理量表评价方式,最常见的是5点量表(如大学生一般学业情绪问卷),分别是:非常同意、同意、不确定、不同意、非常不同意。也可以使用3点量表方式,如同意、不确定、不同意,对于年龄较小的儿童(如小学生)使用3点量表,他们可能更容易做决策。有时也有研究者采用5点以上的评价方式。测试时被测试者可以根据自己的实际情况选择最适合自己想法的一个进行标记。在实际应用中,这种形式的量表分半信度和重测信度可以达到0.8或以上。
里克特量表评价方式具有很好的灵活性,适用于各种态度测量,所有典型的描述肯定或否定态度的问题都可以采用这种方式。在测验中将肯定态度和否定态度的问题混合编排有利于减少被测者没看清楚题目就随意选答案的倾向。但是,在编制否定态度的题目时应当注意自然而成,不要露出太明显的人为痕迹,办法是尽量使用简单的语言和词汇。
3. 等级量表(rating scales)
等级量表本质上与里克特量表没有什么不同,通常用来描述同一个因素影响程度的差异。例如:无影响、轻度、中度、偏重、严重。这种方式在评估被测者的精神症状和问题的临床量表(如SCL-90)中普遍使用。在教师评估学生的非认知功能(如自我导向学习倾向性量表)或学生对教师教学质量的评价时也常会使用。
等级量表的评估效果有时候容易受评价者所掌握的评价标准的准确性、评价者熟练程度影响,研究显示有经验的评价者得到的结果其信效度比缺乏经验者高.
4. 语义区分量表(semantic differential
scales)
这是一种测量心理意义的有用工具。这种量表最早由Osgood于1957年研创,其经典方法是在一个三维语义空间中来评价被测者对某个具体或抽象事物或概念的态度。研究表明通常用3个维度就能够解释大部分变异,这3个维度分别是:性质(例如好-坏)、力量(例如强-弱)和活动(例如快-慢)。在设计量表时需要为被评估的某个内容或概念设计3-15组意义相反的形容词,每组都要包含这3个维度(分量表),最少也要设计3组。下面是一个对教师进行评价的举例:
一般采用7点评分,同一维度的项目根据性质的方向给予1-7分评分,通常给予正性评价高分,负性评价低分。例如在性质维度给“好”“有价值”和“有帮助”这3个端点7分,而在“坏”“无价值”和“无帮助”这3个端点给1分;同理,在力量维度给“大”“强"和“严厉”这端7分,给“小”“弱”和“轻松”这端1分;而在活动维度给“快”“主动”和“平静”这端7分,给“慢”“被动”和“激动”这端1分。设计问卷时注意,不要将性质方向相同的形容词放在同一边,以避免被试者形成定势,不加思考地随意作答。
研究结果表明:当评估的内容或概念性质比较清楚、容易界定时,运用语义区分技术编制量表相对比较容易;而且语义区分量表较等级量表更容易实施,适合低年级学生或文化程度偏低的被试者;其信度也比较好,常可达0.8或以上。但是这种量表的可塑性较差,对于许多概念很难找到适合的形容词来描述它,或者难以满足3个维度的要求。另外,结果解释时给出的信息较少,许多测验者就直接用题目(形容词)解释被试者的特征。
5. 自我报告调查表(self-report inventories)
自我报告调查表与里克特量表或等级量表没有本质上的差别。典型的自我报告调查表指那些要求被测者以“是"或“否”方式回答,或者以“是”“不知道”或“否”方式回答的量表。这种方式被广泛地用于评估个体的习性、态度和技能。
6. Q-分类技术(Q-sort technique)
Q-分类技术由Stephenson于1953年发明,是常用于测量态度、兴趣和其他情感变量的方法。被试者将一组附有问题、特征、图片或其他内容的卡片对照自己的情况分成9个等级(也可以分为5个、7个或11个等级)。每次只能遵循一个分等原则,如从“最重要”到“最不重要”,或从“最喜欢”到“最不喜欢”等。通常每个等级里卡片的数量接近正态分布,即“最重要”和“最不重要”等级的卡片较少,中间等级的较多。卡片的内容通常设计成与某个特殊目的有关,分类结果反映了被测者自己的倾向,Q-分类技术多用于心理咨询和心理治疗实践。
Q-分类技术实施和计分相对较烦琐,项目较多、测验时间较长,而且每次只能评估一个维度,因此不如里克特量表或语义区分量表使用得广泛。
7. 问卷(questionnaires)
将一些问题印制在纸上,邮寄给特定的人群,请其填写完毕后寄回。问卷通常是从一些有关被测者背景的问题开始,例如性别、出生日期、受教育程度等。问卷多采用等级量表的方式调查被测者对某些问题的态度和看法。
问卷除了具有各种自我报告工具所共同存在的缺陷外,还存在一些特殊的问题。对于通过邮寄回收的问卷,研究者不知道被测者是在什么时候和何种情况下完成的,事实上从许多回收的问卷中可以发现被测者完成得非常草率,漏填或填错的情况很常见。一般情况下都有一定比例的问卷收不回来,这种情况可能使研究结果产生偏差。比较科学的做法是在问卷研究计划中至少设置1-2个随访组,调查没有邮回问卷的被试者,由此可以判断这些未邮回问卷者的态度,修正影响调查结果的误差。即使是百分之百回收的问卷,研究者在做结论时也要谨慎,被调查者所报告的感受,不一定是他的实际感受,他们在填写时的疏忽、记忆错误、故意隐瞒都可能在一定程度上影响结果。
8.
形容词核查表(adjective checklists)
形容词核查表的编制、实施和计分都不难。在编制这种测验时,研究者需要将能够描述所要测量的心理特征的相关形容词尽可能找出来,经过仔细筛选后确定要保留的形容词。