829 克隆巴赫解读.docx-资源下载

829 克隆巴赫解读.docx

1、829 克隆巴赫解读克隆巴赫一、人生经历克隆巴赫（1916-2001，享年85岁。），美国教育心理学家，在心理测量上有着卓越贡献。出生于加利福尼亚州弗雷斯诺的一个犹太家庭，因心脏病逝于加利福尼亚州帕洛阿图市。在他5岁时候接受了斯坦福 - 比奈智力测验，测验结果显示他的智商高达 200，被家乡的心理学家肯明斯女士选为天才遗传研究项目的一员。但根据克隆巴赫表示，他是在距离当初的智力测验几十年后才得知，推孟博士的研究人员将自己第一次的智力成绩视为无效，仅认证他第二次测得的较低的智商。就在他接受第一次智力测验后，肯明斯女士就安排年仅 5 岁的他进入小学二年级就读。到他五年级时（8岁），受教于一位行为

2、“疯狂”的女老师，该老师拥有极高的教学热忱，但迫于退休年龄限制，使她无法继续教学，于是便向学校提出加倍教学进度的提案；在学校准许之下，这位女老师便在一年中教完小学五、六年级的所有课程，也因此克隆巴赫于 14 岁时便从高中毕业，18 岁便大学毕业。1934 年，他获得弗雷斯诺州立大学的学士学位，紧接着在1937年获得加利福尼亚大学伯克利分校的硕士学位。由于瑟斯顿研究态度测量，克隆巴赫对教育学和心理测量学很感兴趣。瑟斯顿的研究引起了克隆巴赫的兴趣，促使他在1940年获得了芝加哥大学教育心理学的博士学位。1967年，克隆巴赫是获得桑代克奖的教育心理学事业成就者之一。在二十世纪 30 年代末期，他开始

3、在弗雷斯诺高中教授数学及化学，后来又成为华盛顿州立大学的心理学助理教授，继而转任芝加哥大学、伊利诺大学，1964年又在斯坦福大学教学。二、获得的奖励克隆巴赫是美国心理协会的主席，美国教育研究协会的主席。也是国家科学学会、国家教育学会、国家哲学协会和美国艺术和科学学会的会员。1957 年当选美国心理学会主席，1973 年获杰出科学贡献奖，1974 年当选为国家科学院院士。克隆巴赫被认为是“有史以来，最突出，最具影响力的教育心理学家。”在2002年发表的普通心理学评论中显示：克隆巴赫在20世纪在引用最多的心理学家中排名第48位。此外，他也获得瑞典大学、芝加哥大学和耶希瓦大学的荣誉博士学位。三、取得

4、的成就在1948年，伊利诺斯大学，克隆巴赫有很多成果：阿尔法系数（克隆巴赫，1951年），1957年发表在科学心理学杂志上的一篇 “科学心理学的两个领域”的论文，在这篇论文中，他提出：实验心理学和相关心理学（他自己归纳的）之间的差异很大。对教育心理学的贡献克隆巴赫的研究可以分为三个主要领域：测量理论、项目评估与教育。这里面包括几个问题：例如，教学过程的本质，描述不同教学互动的测量，教学项目的评价，和教育心理学作为一个新兴社会科学学科的愿望。他在测量学问题的贡献对所有的教育心理学来说都很重要。这些贡献包括：心理建模技术的改进和重建，它超出了心理测量行为的精确理解。克隆巴赫对教育心理学的贡献不计其

5、数，他要求在学会对教学进行回应时候有个更好的解释，教育心理学家都得益于此。克隆巴赫能够敏锐的把握教育研究的敏感度，诸如：不同的学生会如何应对不同学习环境中的要求。他提倡使用广泛本地研究和田野教学法，来促进教和学的有用叙述。克隆巴赫的贡献包括：改善需求教学情境中的个人情形互动理解的问题，认识到严格科学的丰富性有利于哲学的多元化和经验主义议程，并且强调环境的作用和改善教学进程的解释一样重要。克隆巴赫发展了评估设计、实现和分析的框架。他认为将提供项目实施者和机构的建设性反馈作为评估目的是不正确的。相反，设计、实施、分析才是真正的反馈目的。在某种程度上，研究作为改善社会事实的一些部分作为目的才是研究的

6、价值。这使得克隆巴赫为传播挑战意识和实施项目评估的前景的研究者和教育心理学的实践者制定方案更像是一个导路地图。在每一代社会科学的特殊任务就是弄明白当代事实。除此之外与努力洞察当代人际关系的人类学者和艺术家分享，并且为了将人类的文化观念和当前的事实联系起来。（一）阿尔法系数他创建了一套常用的衡量心理或教育测验可靠性的方法克隆巴赫系数(Cronbachscoefficientalpha)，并在此基础上建立了一个用于确定测量误差的统计模型。克隆巴赫致力于研究对教育测量学领域有巨大影响的信度的概念。他最早的贡献是在1951年发展出了阿尔法系数，这是心理或教育测验中最常用的信度评估信度工具。阿尔法系数是

7、一套常用的衡量心理或教育测验可靠性额方法，依一定公式估量测验的内部一致性，作为信度的指标。它克服部分折半法的缺点，是目前社会研究最常使用的信度指标，它是测量一组同义或平行测“综合”的信度。一种确定教学和心理学测试的信度的方法。产生了对信度指数的新的解释。克隆巴赫创建了这种准则：可以通过许多测试和测量手段获得一个在实践者中的流行度的一个巨大的数量。克隆巴赫的阿尔法系数提供从一个单独实施的测验得出的信度的测量。因此展示了在重复的场合，或者甚至是来自测验的其他的对比，没有必要去评估一个测试的一致性（这是紧密的跟随库德和理查德森的工作）。阿尔法是有用的，不仅仅是因为它容易计算的，也是因为它具有普遍性，

8、而且具有普遍适用性，例如：二分法取得了多项选择题和polytimous态度量表。而他的建树、包括他所提出的论文心理测验的建构效度，在测验得分的解释上也扮演着突破性的角色。克隆巴赫系数公式为信度系数，n 为测验题目数，S2i为每题各被试得分的方差，S2t为所有被试所得总分的方差。一般来说，该系数愈高，即工具的信度愈高。在基础研究中，信度至少应达到 0.80 才可接受，在探索性研究中，信度只要达到 0.70 就可接受，介于 0.700.98 均属高信度,而低于 0.35 则为低信度，必须予以拒绝。而这也致使他发展出一套辨识测量误差来源的统计模型，即概化理论。（二）概化理论（G理论）因为克隆巴赫在

9、1950s对信度的进程的研究，推进了他对概化理论的研究。他开始了他的工作，目的是研究出一个对测量手册:允许人们将数学概念运用在改变一个人的行为和定量结果的事件上。克隆巴赫认为在观察考试成绩到真实的得分和错误的成分的概念里有两个缺陷：他认为真实的分数是“病态的”，错误是“无所不包”的。概化理论提出这样一个问题：基于测试是如何实施的不同概念的测试行为的真实影响是什么。一个问题将得到解决，例如：在不同场合时候，学生的表现会一致吗？当克隆巴赫开始考虑无差别的错误项目包含关于对测试表现很重要的系统变异的相关信息。带着这种想法，他联合其他两名成员发展了一个“随机模型”（被英国统计学家费舍尔介绍），他决定找

10、出误差方差的复杂性。这个“G”理论因此提供了心理学和数学的组合，这个组合产生了一个确定测量误差来源的综合的框架和统计模型。克隆巴赫的理论超越了在学生的相对的分布格局的测试一致性他认识和了解到被用于任何测试的特殊项目只是一个来自一个广泛的知识领域的一个小指示符。只有这样一个信度调查的扩展有可能被广泛的理论制作允许研究者获得更多现实教育问你，并且在他们查询证明的有效性是重要的，尤其是当评估考试成绩信息提取的时候，鼓励研究人员广泛考虑。在保罗米尔表的帮助下，克隆巴赫将有效性理论的概念放在教育心理测量的中心文职。克隆巴赫和米尔认为：心理学家（倡导建构效度）使用他们的方法论思考是必然的，因此，它的合理性

11、，它的科学性，和它的危险性可能会变得明确和熟悉。这将是广泛的趋势：致力于世纪的数量来构建实证研究和使用世纪测验的建构，尽管在采取“操作”的方法，如果通过的话，会迫使研究诸如一个放不下的模具里面。克隆巴赫将信度看作是一个测试的一个重要特征，但是相信信度和效度会联合起来，而且有时候为了提供可靠性，“二者之间的权衡”是有必要的。在克隆巴赫和米尔一起写的这篇文章中Construct Validity in Psychological Tests在心理测验的结构效度中，代表着他们超过50年的研究工作的有效性。（三）评估和教育领域他的研究不仅跨越测量和测验，同时也囊括评估和教育领域。在 70 年代，他负责

12、主持斯坦福评鉴会，这是由教育学院和心理系教职员所赞助的机构，主管研究、服务和训练；而此评鉴会也与加州教育局合作，共同检视并重新界定州政府与学区间的关系和其他计划。他的评估研究影响许多领域中的计划评估，从健康计划到少年犯计划都有；而他在教育方面的贡献也颇负盛名，十九世纪 50 年代，他就指出学习环境应当针对个人能力而设计。在他担任美国心理学会主席的期间，他试图以“环境和个体行为具等同重要性”的概念横跨不同心理学理论。在教育心理学领域，克隆巴赫强调课堂实践和基本的心理学原则，特别是那些一般化和可以迁移的原理之间的关系。除此之外，克隆巴赫还把测验用于心理诊所，并且涉及以心理测验的运用为基础的社会政策

13、。他有关心理测验的著作，对测验的发展和应用强调普遍临界原则。在他出任美国心理学会测验标准委员会主席时，为维护人格测验和能力测验的质量而制定了一个法规。他还与 G.C.格莱塞合作制定过一个 15 年规划，该规划为改变测验分数的个人能力测验图的运用方法提供了建议。相关1.Jump up Friedman, Howard (2011). The Longevity Project. New York: Hudson Street Press. pp. 7677. ISBN 978-1-59463-075-0.弗里德曼，霍华德（2011）。长寿项目。纽约：哈德逊街出版社。第7677。国际标准书号978

14、-1-59463-075-0。2. Jump up to: a b c d e f g h i Kupermintz, H. (2003). Lee J. Cronbachs contributions to educational psychology. In B. J. Zimmerman and D. H. Schunk (Eds.). Educational Psychology: A Century of Contributions, pp. 289-302库珀明茨，H（2003）。Lee J. Cronbach对教育心理学的贡献。B. J.齐默尔曼和D. H.申克（主编）。教育心理

15、学：一个世纪的贡献289-302，pp.3.Jump up Haggbloom, Steven J.; Warnick, Jason E.; Jones, Vinessa K.; Yarbrough, Gary L.; Russell, Tenea M.; Borecky, Chris M.; McGahhey, Reagan et al. (2002). The 100 most eminent psychologists of the 20th century. Review of General Psychology 6 (2): 139152. doi:10.1037/1089-268

16、0.6.2.139.haggbloom，史提芬J.；Warnick，杰森E.琼斯，代言人；K；亚伯勒，加里L.；罗素，tenea M.；博雷茨基，克里斯M.；mcgahhey，里根等人。（2002）。“20世纪最著名的100位心理学家”。普通心理学评论6（2）：139152。DOI：10.1037/1089-2680.6.2.139。4. Jump up to: a b c d e Shavelson, R. J. (2003). Lee J. Cronbach. The American Philosophical Society, 147(4), 380-385.谢弗而森，R. J.（20

17、03）。克隆巴赫.美国哲学学会，147（4），380-385。5.Jump up Cronbach, L. J. 1975. Beyond the two disciplines of scientific psychology. American Psychologist 30:67184.表1975，克隆巴赫.超越这两个学科的科学心理学。美国心理学家30:67184。6.Jump up Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16,297-33

18、4.信度，L. J.（1951）。系数与测试的内部结构。心理测量学，16297-3347.Jump up Cronbach, L. J., & Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.度，L. J.，&米尔，体育（1955）。心理测验的结构效度。心理学报，52，281-302。8.Cronbach, L. J., & Shavelson, R. J. (2004). My current thoughts on coefficient a

19、lpha and successor procedures. Educational and Psychological Measurement 64, no. 3, pp. 391418信度，L. J.，&谢弗而森，R. J.（2004）。我目前对系数和继任者的程序的思考。教育与心理测量64，3号，391页4189.Sternberg, Robert J. (Ed); Pretz, Jean E. (Ed). (2005). Cognition and Intelligence: Identifying the Mechanisms of the Mind; New York: Cambri

20、dge University Press, 2005. 345 pp斯腾伯格，罗伯特J.（ED）；普里茨，琼E.（ED）。（2005）。认知与智能识别思维机制；纽约：剑桥大学出版社，2005。345页瞿葆奎教育评价M北京：人民教育出版社，1989：159-179通过评价改进课程陈玉琨赵中建译Cronbach,L.J.,Course Improvement Through Evaluation.Teachers College Record,Vol.64,1963. 背景全国掀起教育改革的浪潮，尤其是对中学的改革。在由全国科学基金会资助的教程内容改进大纲负责人的历次会议上，也经常提出评价问题。

21、提问者的动机：从对课堂纯属科学的好奇到期望能使资助者确信，经费得到了合理的应用。克隆巴赫认为某些评价技术以及评价专家的思维习惯并不适合当前的课程研究。提出的问题我们需要什么样的评价哲学观和评价方法？我们怎样方能从为大家所熟悉的测验游戏的教义与仪式中摆脱出来呢？评价为决策服务一、评价的定义为作出关于教育方案的决策，收集和使用信息。二、评价的决策（目的）的三种类型：教程的改革（course improvement）：确定何种教材和教学方法是令人满意的；以及何处需要改革。关于个体的决策(decisions about individuals):为规划教学而辨明学生的需要；为选择与分组而判明学生的长处

22、；掌握有关学生的进步与不足的情况。行政的调控(administrative regulation)：判断学校系统的优良程度，教师个体的优良程度。三、评价的发展历程最初，正是为了教程改革，人们才引进了系统的评价。（一）赖斯（Rice,J.）给美国一些学校提供相同的拼字测验，并以其收集的证据证明了这种活动没有价值。（二）20世纪20年代，背景：教程内容除了课题重点有所变化，其他都几乎没有变化；在行政指导上，标准化测验被用来评定教师或学校系统的效率。一些希望更多地了解其成果的管理者正在设立“操作研究机构”。质量控制导向的测验在除了大学之外的中学似乎也将有所增长。（三）30年代前后，学生的测验基本上还

23、是集中在事实性知识和基本技能的掌握方面。这一时期的人们开始强调对编制测量的过程进行评估，而不去评估由此得到的测验或测验的数据。泰勒，林奎斯特（Lindquist）等人提出学生的一般成长要比掌握教师所提供的特殊的课重要的多。布卢姆认为：判定学校质量及其教育作用的准则应是学校达到它为自己所判定目标的程度。一方面，教学工作者参与选择及编制评价工具导致工具的改进，另一方面，他们的参与也导致教学目标的明确，并使这些目标对教室来说既真实又有意义。1.在为教程改革而进行评价时，其主要意向是确证教程具有何种效果，即在学生方面产生何种变化。评价能完成的最大贡献是确定教程需要改进的方向。2.把以教程与另一教程进行

24、比较的意向，不应在评价计划中占支配地位。3.把一教程与另一教程进行比较的意向，不应在评价计划中占支配地位。总结行政的调控，测量必须使全面的且具有显而易见的公平性。个体的测验必须十分公正且全面，这样才能提供对每一个人来说都可靠的分数。评价的方法方法的范围评价的方法包括过程研究，水平测量，态度测量和追踪研究。过程研究关心发生在课堂中的事件，水平和态度测量基于学生方面被观察到的变化，追踪研究基于曾参加过这一教程的人以后的职业生涯。一、追踪调查追踪调查一种明显的形式是追溯学生在大学课程中的成功程度，这一大学的教程是承继高中教程的。二、态度测量修毕某一教程的一定数量的学生表达的非预期的观点。三、过程测量

25、表明在教学中怎样才能改进教程方面具有特殊的价值，可以把注意力转向教师课堂中的活动上来。水平的测量试题的资料比测验成绩更重要。理想的评价应包括测量所有类型的水平，这种水平在问题的领域被期望是有理由的，而不只是这一课程给与实质性主义的经选择的结果。理想的教学评价将收集这一教程合理地把它们作为目标的全部能力的证据。测验必须与教程的意向密切配合。测量智慧能力就是测量知识的深度，关联性及应用。很多新课程的主要目标似乎是为了发展学生掌握该领域新材料的能力倾向。通过一个教程培养学生理解哪些对不熟悉技能的描述，去领会新的理论和其中的推理过程，以及设计实验以检验这些新的假设，这就是学习的迁移。结论教育评价应确定

26、教程产生了何种变化以及应确认教程需要改进的方面。观察到的结果应包括一般的结果，超过课程本身内容的一般结果：态度、职业的选择；一般的理解力和智慧能力，以及在该领域进一步学习的能力倾向。对每种试题或每类问题作出的成绩的分析比对综合成绩的分析更能增进我们的理解。评价是课程编制的一个基本部分，而不是一个附加物，它的工作是收集教程编制者能够和将用以使其工作做得更好的事实，以及那些有助于对教育过程产生更深入的理解的事实。P744教育评价术语 1.评价、评定、测量 Evaluation,Assessment,and Measurement2.教育测量 Educational Measurement3.教育评

27、定 Educational Assessment4.教育评价 Educational Evaluation5.鉴定 Accreditation6.目的和目标（Goals and Objectives）7.准则（Criterion）8.标准（Standards）9.总结性评价（Summative Evaluation）10.形成性评价（Formative Evaluation）11.启发式评价（Illuminative Evaluation）12.相互作用评价（Transactional Evaluation）13.目的游离评价（Goal-Free Evaluation）14.评价的医疗模式（M

28、edical Model of Evaluation）15.“硬”评价与“软”评价（“Hard”and“Soft”Shibboleths in Evaluation）16.项目特征曲线理论Item Characteristic Curve Theory (ICC Theory17.特尔斐技术（Delphi Technique）1 斯塔费尔比姆等著评估模型M苏锦丽等译.北京：北京大学出版社，2007：275-288克隆巴赫以评估改进课程主要是为了评估并增进某一方案的优点和价值。企图提供广泛的评估。一、评估的定义：收集和利用资料，以完成有关教育方案的决策的一种多样化的活动。（以评估做决策）往常

29、的测验原则并不完全适用在课程改进方面，我希望先区分评估的目的，并探讨评估和测试及其与课程设计历史发展之间的关联。二、评估的目的：建构一种能对课程研究有所贡献的评估理念和方法1.改进课程（课程）改进教材或方法（必须考虑时间性和地区性的因素）。对测量程序的要求：当测验是用来判断一个课程时，就可以用一个样本为基础收集数据，做出令人满意的解释，而不必要求彻底测量任何一个班级的成就。2.改进学生（教学）根据学生的需要来安排合适的教学计划、根据学生特质来进行筛选和分组，并使学生知道自己的进步和不足。对测量程序的要求：个人的测验必须公平，内容要广泛，足以提供个人确实可靠的分数。3.行政上的管制（管理）判断学

30、生的好坏，以及个别教师的好坏。也是地区性的。例如：标准化测验对测量程序的要求：当测试是用来提供给个别教师做行政判断时，就必须要全面测量，保证公平性。三、历史发展过程为了改进课程，就有了系统化评估的出现。1. Joseph Rice（约瑟夫莱斯）在一些美国学校进行的拼字测试。目的：主要是为了改革学校中不断扩张拼字技巧训练的现象。旨在评估课程。2.（行政上的管制）20世纪20年代，在行政主管的引导下，进行标准化测试目的：评估教师或学校系统的效率。20世纪20和30年代，转变思想，认为要判断学校课程的适当性，需靠描述课程的性质。3.（有关个人的决策）1930年以后目的：用来判断个人成就。（为了做决策

31、，个人的测验分数要能准确、有效地与别人比较，或与某一标准比较，于是大多数测试的理论和技术非常重视测量的准确性。）过渡：1935年以前，学生所做的测验大都属于事实性知识和基本技巧的熟练度（事实性测验、陈述性测验）。课程发展者认为如何评定学生的一般教育成长是很重要的，这比学生是否熟悉某些特定科目的内容更为重要。5.地区性的、有益的教师训练活动最好的学习经验应该是由每间教室里的师生共同计划所产生的。编制测验的过程比测验本身或测验结果所得到的数据更有价值。（布鲁姆：我们决定一个学校的质量及其教育功能的准则，主要是看学校达到他们先前所设定目标的程度，只有学校将目标转化为明确的操作型定义，才能从目标着手，

32、否则只有学校将目标转化为明确的操作型定义，才能从目标着手，否则只能徒留下美丽的希望或只是一些陈词滥调而已。）6.布鲁姆和泰勒认为课程编制和评估是班级教学中一个整合的过程，而且必须采取地方分权、因地制宜，这一种看法和目前课程改进方向大相径庭。目前国定课程研究假设编制应该集权化，以相同方法提供相同教材给任何地方的教师使用，他们的基本假设是：由专家设计教材，并经过试用、修正，比起各地教师个别设计课程，可以发展出更好的教学活动。（1）当为了改进课程而实施评估时，其主要目的在于确定课程究竟有什么成效，亦即学生产生了什么变化，而不只是探究课程有效或无效。因此，既然一个综合的分数常会掩盖对不同方面结果重要性的判断，所以评估报告要能分开处理不同方面的结果，这样对不同价值体系

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？