心理测量学教案设计郑日昌版Word下载.docx
《心理测量学教案设计郑日昌版Word下载.docx》由会员分享,可在线阅读,更多相关《心理测量学教案设计郑日昌版Word下载.docx(112页珍藏版)》请在冰点文库上搜索。
1879年他在德国莱比锡大学建立了心理学史上第一个实验室,引发了个别差异的研究。
2、实验心理学的诞生和发展,给心理测验带来了另一个副产品:
严格的标准化程序。
三、心理测验的发展(金瑜P7-9)
1、高尔顿:
英国生物学家和心理学家高尔顿是倡导测验运动的主要人物。
他设计了测量差异的方法,1884年,他在伦敦国际博览会中专门设立了个“人体测量学实验室”六年中积累了9337人的资料,虽不是正式的心理测验,但可视为心理测验的开端。
他还是评定量表和问卷法应用的先驱,他的另一个重要贡献是为心理测验奠定了统计学基础,并第一个提出了相关的概念。
(皮尔逊相关)
2、卡特尔:
美国心理学家,从师冯特。
1890年,卡特尔在《心理》杂志上发表“心理测验与测量”,这是心理测验第一次出现于心理学文献中。
3、世界上第一个智力测验:
比内与助手西蒙在《心理学年报》上发表了一篇文章,题为:
“诊断异常儿童智力的新方法”,是世界上第一个正式的心理测验。
比内-西蒙量表自1905年发表后,在1908年修订,1908年量表题目总数达到了59个,所有测题按年龄分组,组别从3-13岁,测验的结果用“智力水平”表示,但其通常翻译和提法为“智力年龄”。
后又经1911年修订一次。
4、心理测验的蓬勃发展:
(1)操作测验的发展:
理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。
(2)团体智力测验的发展:
这是心理测验方式的极大进步,也扩大了测验的应用范围。
(3)能力倾向测验的发展:
韦克斯勒所编的学前儿童、学龄儿童、成人智力量表。
(4)人格测验的发展:
心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。
(5)现代西方心理测验的发展,受到计算机的产生和发展,以及统计方法的改进的极大影响。
四、现代心理测验在中国的发展:
以1949年中华人民共和国成立为分期
(一)中华人民共和国成立前心理测验的发展
1、1916年,樊炳清先生首先介绍了比内-西蒙智力量表;
2、1920年,廖世承和陈鹤琴在南京高等师范学校开设心理测验课,并用心理测验试测投考该校的学生,这便是中国正式开始的科学心理测验;
3、1921年,他俩正式出版《心理测验法》一书,成为中国最早的心理测验专著;
4、1922年,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学,并主持编制心理测验事宜;
5、1924年,陆志韦发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订;
6、1931年,由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会;
7、1932年,《测验》杂志创刊。
(二)中华人民共和国成立后心理测验的发展
1、1979年,林传鼎、张厚粲等以国外资料为参考,编制了少年儿童学习能力测验;
2、1989年,成立中国心理学会心理测验专业委员会,标志着中国心理测验已进入了一个新的高速发展时期。
第二节心理测验的性质
一、测量的基本问题
(一)测量的定义
1、定义:
测量就是根据一定的法则,用数字对事物加以确定。
a一定的法则:
是指测量行为发生时采用的规则或方法。
b事物:
是指我们要测量的感兴趣的事物的属性或特征。
c数字:
可以表示数量,也可以不表示数量。
d通常人们所说的测量,指的是给事物确定出一种数量化的价值。
2、测量的要素:
一是参照点,二是单位
a参照点:
一种是绝对的零点;
一种是相对参照点,是认为确定的。
最理想的参照点是绝对零点,心理测验中所用的参照点都是相对的,因而测量的结果常常不能以“倍数”的方式解释。
b理想的单位的条件:
有明确的意义和有相等的价值。
3、测量的量表:
量表就是有参照点和单位的连续体。
斯蒂文斯将量表由低到高依次为:
a命名量表:
是水平最低的一种测量量表,用数字来代替事物或对事物进行分类;
b顺序量表:
不仅表明类别,还能表明不通类别的大小等级,或具有某种属性的程度;
c等距量表:
不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝对零点,所以不能做乘除运算;
d比例量表:
是最精确的测量,既有相等的单位,又有绝对零点。
二、心理测量的基本概念
是根据一定的法则用数字对人的行为加以确定,即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
2、特点:
(1)心理测量的间接性
(2)心理测量的相对性
3、心理测量的水平
心理测量,不论是对智力,还是对能力倾向或人格的测量,都只具有等级量表的特征。
测验分数一般只能显示个体智力、能力、人格上的等级位次,而没有一个相等的单位,故它不是一个等距量表。
但由于多数心理特征具有常态分布的特征,且没有绝对零点,所以我们也可以把测量后直接得到的原始分数转化为常态分布下的标准分数,把这些量表当作等距量表来处理。
三、心理测验的基本问题
(一)心理测验和心理测量的的联系和区别
心理测验是了解人心理的工具,主要在名词上使用。
而心理测量则是运用测验为工具,达到了解人类心理的实践活动,它主要是在“动词”意义上使用。
因此,相对而言,心理测量的意义范围更广一些。
能被应用于实际心理测量的心理测验才是真正有效的测验工具才是真正有效的测验工具。
(二)心理测验的定义
心理测验就是通过观察人的少数有代表性行为,对于贯穿在人的全部行为活动中心理特点作出推论和数量化分析的一种科学手段。
心理测验即是依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
(三)心理测验的要素
1、行为样本:
对少数经过慎重选择的样本进行观察,来间接推知被试的心理特征。
2、标准化:
是指测验编制、实施、记分以及测验分数解释程序的一致性,标准化的量一个重要步骤是建立有代表性的常模。
3、客观性:
在不受被试主观判断支配的范围内,测验的实施、评分、解释应是客观的,要尽量减少主试和被试的随意程度。
客观性另一个主要方面是测题或整个测验的难度水平的确定必须客观。
神经心理测验客观性最高,智力测验较高,人格问卷次之,投射测验的客观性较低。
(四)心理测验的性质
1、心理测验的间接性;
2、心理测验的相对性;
3、心理测验的客观性:
心理测验标准化包括:
①测验用的项目或作业、实测说明、实测者的言语态度及实测时的物理环境等,均经过标准化。
②评分记分的原则和手续经过了标准化,对反应的量化是客观的。
③分数转换和解释经过了标准化,对结果的推论是客观的。
第三节心理测验的种类
一、按测验功能分类:
1、能力测验:
智力测验:
比内-西蒙智力测验、韦克斯勒儿童和成人智力量表。
特殊能力测验:
如音乐、绘画等
2、成就测验:
用于测量个人(团体)经过某种正式教育或训练之后对知识和技能掌握的程度。
学科测验
3、人格测验:
用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等方面的个性心理特征,即个性中除能力以外的部分。
明尼苏达多项人格调查表(MMPI)、16种人格因素问卷(16PF)、艾森克人格问卷(EPQ)、罗夏墨迹测验、主题统觉测验(TAT)。
二、按测验对象分类
1、个别测验:
优点:
主试可以仔细观察被试的言语情绪,并有充分的机会与被试合作,所以其结果正确可靠。
缺点:
时间不经济,不能在短时间呢您收集到大量的资料。
2、团体测验:
时间经济,主试不必接受严格的专业训练即可担任。
主试对被试的行为不能作切实的控制,所得结果不及个别测验正确可靠。
三、按测验方式分类:
1、纸笔测验:
言语作为刺激。
MMPI、EPQ、16PF及韦克斯勒儿童和成人智力量表中的言语量表部分。
实施方便,团体测验多用,有肢体残疾而无言语困难的病人只能用此。
受被试文化程度的影响。
2、操作测验:
也称非文字测验。
罗夏墨迹测验、主题统觉测验、瑞文测验及韦克斯勒儿童和成人智力量表中的操作量表部分。
不受文化因素的限制。
3、口头测验
4、电脑测验
四、按测验目的分类:
1、描述性测验:
目的在于对个人或团体的能力、性格、兴趣、知识水平等进行描述。
2、诊断性测验:
目的在于对个人或团体的某种行为问题进行诊断。
3、预示性测验:
目的在于通过测验分数预示一个人将来的表现和所能达到的水平。
五、按测验难度分类
1、速度测验
2、难度测验
六、按测验要求分类
1、最高作为测验
2、典型作为测验
七、按测验性质分类
1、构造性测验:
在此种测验中,所呈现的刺激和被试的任务是明确的。
2、投射性测验:
在此种测验中,刺激没有明确意义,问题模糊,对被试的反应也没有明确规定。
八、按测验解释分类
1、常模参照测验
2、标准参照测验
九、按测验应用分类
1、教育测验
2、职业测验
3、临床测验
第四节心理测验的功能与应用
一、心理测验的功能:
最基本的功能是测量个体差异或行为反应。
(一)从实际应用角度看:
①人才选拔;
②岗位安置
③临床诊断;
④教育评价;
⑤心理咨询和治疗
(二)从理论研究角度看:
①搜集材料:
心理测验是收集个体差异资料最快捷的办法。
②提出和验证假设
③实验分组
二、测验的应用
(一)错误的测验观
1、测验万能论
2、测验无用论:
①某些人格测验侵犯了个人隐私;
②测验为宿命论和种族歧视提供了心理学依据。
3、心理测验即智力测验
(二)正确的测验观
1、重要的心理学研究方法和决策的辅助工具:
心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。
2、作为研究方法和测量工具尚不完善:
过分夸大心理测验的科学性和准确性是不对的。
3、科学地看待心理测验,防止乱用测验:
①测验使用者必须具备一定的资格;
②慎重选择测验量表;
③与被试建立良好的协调关系;
④正确解释测验结果;
⑤注意测验的保密。
第二章心理测验的编制
(1)掌握心理测验编制的一般程序
(2)心理测验的难度与区分度的定义及
[教学重点与难点]心理测验的项目分析
[教学时数]4学时
第一节编制测验的一般程序
一、确定测验目的
(一)心理测验的对象:
首先要明确测量的对象,也就是测验编成后要用于哪些团体。
A年龄
B教育水平:
在编制儿童测验时,要同时考虑教育水平和年龄的影响。
在承认测验中,一般只考虑教育水平的影响。
C文化背景
(二)测验的目标:
是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
目标分析以测验不同而异,一般分为三种情况:
A工作分析:
主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。
B对特定概念下定义:
如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。
C确定测验的具体内容:
如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能。
(三)测验用途:
所编出的测验是要对被试做描述,还是做诊断,抑或是选拔和预示。
二、拟定编制计划
编制计划,实际上是对测验的总体设计,指出测验的内容结构和项目形式等,以及对每个内容、目标的相对重视程度。
根据布鲁姆最早提出教育目标的分类问题。
他把学习的心理活动分成认知、精神运动和情感三个领域,又把认知领域具体分为知识、理解、应用、分析和综合、评价。
三、设计测试项目
(一)搜集有关资料
1、资料要丰富
2、资料要有普遍性
(二)选择项目形式
1、测验的目的和材料性质
2、接受测验的团体的特点
3、各种实际因素:
时间,人数、经费等
(三)编写和修订项目
1、项目的范围要与测验计划相一致
2、项目的数量要比最后所需的数目多一倍至几倍,以备筛选和编制复本
3、项目的难度必须符合测验目的需要
4、项目的说明必须清楚
四、项目的试测和分析
(一)试测
1、预测对象应取自将来正式测验准备应用的群体
2、预测的实施过程与情境应力求与将来正式测试时的情况相近似
3、预测的时限可稍宽一些,最好使每个被试都能将项目做完,以搜集较充分的反应资料,使统计分析的结果更为可靠。
4、在预测过程中应随时记录被试的反应情形,如在不同时限内一般被试所完成的题数、题意不清之处及其他有关问题。
(二)项目分析
包括质的分析和量的分析
质的分析是从内容取样的适当性、题目的思想性以及表达是否清楚等方面加以分析。
量的分析是对预测结果进行统计分析,确定项目的难度、区分度、备选答案的适宜性等。
五、合成测验
1、项目的选择:
要考虑测验的目的、性质与功能,区分度,难度
2、项目的编排:
由易到难,有并列直进式,混合螺旋式
A一般原则:
a测题的难度排列易逐步上升;
b尽可能将同类型的测题组合在一起;
c各种类型测题本身的特点;
B常见试题排列方式:
a并列直进式b混合螺旋式
3、编造复本
测验的各份复本必须等值,所谓等值需符合下列几个条件:
(1)各份测验测量的是同一种心理特质;
(2)各份测验包含相同的内容范围,但题目不应有重复;
(3)各份测验题型相同,题目数量相等,并且有大体相同的难度分布。
六、测验使用的标准化
1、施测过程标准化
2、评分计分标准化
3、分数解释标准化
七、搜集信度、效度资料
(一)信度
指的是测量的可靠性或一致性。
(二)效度
指的是测量的有效性或正确性。
A搜集有关资料:
题目的有关来源
a已出版的标准测验
b理论和专家的经验
c临床观察和记录
B命题的原则及编写要领
a命题的原则(理解):
○1内容方面:
符合测验的目的,取样有代表性,相互独立,互不牵挂;
○2文字方面:
准确,简明扼要,少使用双重否定句;
○3理解方面:
不要超出受测团体的知识水平和理解能力,不要有争议误解;
○4社会敏感性方面:
应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略:
◇1命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。
◇2命题时假定规范不一致。
◇3指出该行为是常见的,虽然是违规的。
b测题的编制要领:
根据被试的要求不同分为
○1提供型:
要求被试给出正确答案。
○2选择题:
要求被试在有限几个答案中选择正确的答案。
由题干和选项构成。
题干:
呈现一个问题的情境,一般由直接问句或不完全的陈述句构成。
选项:
问题的多种可能答案,常常是包含一个正确答案,若干(一般是1~5个)错误答案,其中的错误的答案叫做“诱答”。
八、编写测验手册
1、本测验的目的和功用
2、测验的理论背景以及选择项目的根据
3、测验的实施方法、时限及注意事项
4、测验的标准答案和记分方法
5、常模表或其他有助于分数转化与解释的资料
6、测验的信度、效度资料,包括信度系数、效度系数以及这些数据是在什么情境下得到的
第二节测验的项目分析
一、项目的难度分析
(一)定义:
1、难度:
是指项目的难易程度。
P在能力测验中通常需要一个反映难度水平的指标,在非能力测验中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的的人数。
2、难度的指标:
以通过率表示难度时,通过人数越多,即P值越大,难度就越低;
P值越小,难度越高。
因为P值大小与难度高低成反比,有人将其称作易度。
(二)难度的计算
1、原始定义法
(1)客观试题(二分法记分):
R:
答对该题的人数;
N:
参加测验的总人数
由于选择题允许猜测,所以通过率可能因机遇作用而变大。
备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。
为此,吉尔福特提出了一个P值校正公式。
CP:
校正后的难度值;
P:
实际得到的通过率;
K:
选项数目
例题:
假定某题有75%的被试通过,若该题有5个备选答案,则校正后的通过率为:
当有4个备选答案时,CP=0.67;
有3个,CP=0.63;
有2个,CP=0.54)
b非二分记分:
例题某一数学能力测验题的满分为20分,全体被试在该题上的平均分数为15分,则该题的难度为:
P=15/20=0.75
例:
一个题目的难度值为0.75,分别计算此题有四个选项、三个选项、两个选项时大的难度值
(2)主观题的平均数法
2、极端分组法
(1)客观题的极端分组法
根据测验分数按高低排序,用两个极端组在某项目上的平均通过率表示项目的难度
PH、PL分别为高分组与低分组的通过率。
步骤:
A、按测验总分由高到低排序
B、从高分段向下选出全部试卷的27%作为高分组
C、从低分段向上选出全部试卷的27%作为低分组
D、按照上述公式计算项目难度值
100人参加某测验,高分组与低分组各取27人,其中第一题高分组20人答对,低分组10人答对。
这道题的难度系数是多少?
(2)主观题的极端分组法
B、从高分段向下选出全部试卷的25%作为高分组
C、从低分段向上选出全部试卷的25%作为低分组
XH:
高分组所得总分;
XL:
低分组所得总分;
H:
该题最高分;
L:
该题最低分;
考生总人数的25%
(三)难度对测验的影响
1、难度对测验分数分布的影响
(1)P值越小→测验项目越难→测验分数集中在低分端→分数分布呈正偏态分布。
(2)P值越大→测验项目越易→测验分数集中在高分端→分数分布呈负偏态分布。
即:
测验项目过份容易或过份难,都会造成测验分数偏离正态分布,而使测验分数的离散程度变小。
2、难度对测验鉴别力的影响
测验的主要功效之一就是鉴别考生实际水平的高低。
自欺欺人适量难度可以加大考生得分的差异,从而提高测验的鉴别力。
P值越接近0.50,试题的鉴别能力就越高;
相反,P值越接近1.00或0,试题的鉴别能力就越低。
3、难度与测验目的的关系
项目难度应根据测验目的来确定,不能认为测验项目都必须保持值等于0.50最好。
事实上,一方面,如果每个项目的难度都等于0.50,测验项目之间存在高度相关,会使测验分数的分布呈双峰状态,即有5%的人所有题目都答对,得满分,另外5%的人全部答错,得0分。
为此,难度水平的确定应根据测验的目的,性质及题目的形成。
(1)对于一般的常模、参照测验而言,其目的在于测量个体差异,一般只要求测验题目的平均难度为0.50,而个题难度可在0.50+0.20之间。
(2)当测验用与选拔或诊断时,题目的难度值应更多地接近录取率。
(3)就选择题而言,P值应大于概率水平。
P值若等于概率,说明被试纯粹凭猜测作答;
P值若小于概率,说明题目很可能存在问题。
(4)整个测验的难度水平取决于组成测验的题目的难度。
(四)难度的转换
难度指出的仅仅是题目的相对难度,不能客观地指出题目难度之间差异大小
P向Z的转换
n假定每个试题所要测量地潜在特质或能力是呈正态分布的,可将P值作为正态曲线下的概率面积,以此转换成Z分数
二、项目的区分度D
(一)区分度的概念
区分度是测验对被试实际水平的区分程度。
是测验项目分析的重要内容
是作为评价项目质量、筛选项目的主要指标与依据
通常用D表示,取值范围为+1.00至-1.00
D越高时,试题的质量越好,D值范围在-1.00和+1.00之间,值越大,试题的区分能力越强。
当D为正值时,说明试题是积极区分,即高分组通过率高,低分组通过率低。
为D负值时,说明试题有消极区分,高组通过率低,低组通过率高。
D为0时,说明试题无区分用
(二)区分度对测验的影响
1.区分度与难度的关系
l试题的区分度与难度有密切关系。
试题难度过大或过小,其区分度都较低。
当难度值为1.00或0时,高分组和低分组或全部通过得满分,或全部未通过得0分,这时区分度都为0分。
这两种情况,都表示试题没有鉴别考生水平高低的能力。
所以,调整试题难度是提高试题区分度的重要方法。
右表可说明难度与区分度的关系。
A、假如样本中通过某一项目的人数比率为1.00或0,说明高分组与低分组在通过率上不存在差异,因此D为0;
假如项目的通过率为0.50,则可能是高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能达到1.00。
B、为了使整个测验项目的潜在区分度最大,似乎应该使每个项目的难度处于0.50水平,但事实并非如此简单。
如果每一个项目的难度均处于0.50,由于项目难度相同,有可能大多趋向于有关的内容或技能,结果造成项目同质性提高。
在极端情况下,有可能50%的被试全部通过各项目得满分,另外50%的被试全部为0分,形成U形分布,这样反而降低总分的区分能力。
如果测验的所有项目都是中等难度,只有项目的内在相关为0时,整个测验才能产生常态分布。
考虑到一般测验项目之间具有某种程度的相关难度的分布要广一些,梯度多一些,是合乎需要的。
2.区分度与信度的关系
一个良好的测验,信度必须要高。
测验的信度与项目的区分度有着密切的关系,事实上,由试题的区分度还可以估计测验的信度。
整个测验中各试题的区分度值的平均数越高,测验的信度就越高。
值的平均数与信度的关系如右表。
(三)区分度计