62葛大汇六学生:学业情感与多元评价.doc

上传人:精*** 文档编号:16110762 上传时间:2023-07-10 格式:DOC 页数:7 大小:148.50KB
下载 相关 举报
62葛大汇六学生:学业情感与多元评价.doc_第1页
第1页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第2页
第2页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第3页
第3页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第4页
第4页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第5页
第5页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第6页
第6页 / 共7页
62葛大汇六学生:学业情感与多元评价.doc_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

62葛大汇六学生:学业情感与多元评价.doc

《62葛大汇六学生:学业情感与多元评价.doc》由会员分享,可在线阅读,更多相关《62葛大汇六学生:学业情感与多元评价.doc(7页珍藏版)》请在冰点文库上搜索。

62葛大汇六学生:学业情感与多元评价.doc

学生:

学业、情感与多元评价

华东师范大学教育管理系葛大汇

学校是学习的场所,因此对学生的评价总是评价学校最为核心的对象。

全面的学生素质评价包括德、智、体等各个方面;目前,在基础教育课程改革中,人们对学生学习过程中的“情感”、“态度”、“价值观”三要素有着格外的关注。

钟启泉等主编《基础教育课程改革纲要(试行)解读》,华东师范大学出版社,2001年版,第276页。

1、“教育目标分类学”

上世纪五、六十年代,继泰勒之后,行为目标导向模式在布卢姆(B.S.Bloom)领导的“统一便于交流的教育目标”的工作中得到了充分的完善。

布卢姆在学生评价的认知领域中的“知识、领会、分析、运用、综合、评价”的目标分类已为我国广大教师和研究者所熟悉。

值得引起重视的是,1964年克拉斯奥尔(D.R.Krathwohl)提出了情感领域目标分类的报告。

这个研究指出:

如果以“内化”的、“价值形成的复合性”和“生长连续体”的观点来看问题,那么情感的或道德思想领域中的学生评价也可以采用有效的“目标行为导向”模式。

此外,还有A.J.哈罗(AnitaJ.Harrow)和E.J.辛普森(ElizatetaJ.Simpson)所作的“动作技能领域”的目标研究。

近来,在学生评价中,人们还关注着奥苏贝尔(D.P.Ausubel)、加涅(R.M.Gagne)等人在认知领域里所研究的行为目标。

葛大汇《学能的理论与结构》,《教育理论与实践》1992年第期11期。

2、学业评价与测验管理

学业评价侧重于认知领域对学生在具体学科上的学习状况进行评价。

在评价的内容属性上,分为学业成就评价(achievemeotevaluatian)和能力倾向评价(aptitudeevaluatian);在评价于教学活动中的作用上,分为形成性评价(formativeevaluatian)和终结性评价(summativeevaluatian),至于诊断性评价(diagnosticevaluatian)和安置(配置)性评价(placementevaluatian)可以看成是广义的形成性评价的一种具体使用功能。

由于学业评价的主要工具是测验,因此就有与上述评价类型同名的测验,例如学业成就测验。

因不同的分类标准,测验的种类,按测验的“客观性”有:

标准化测验和教师自编测验;按“参照标准”有:

常模参照测验和准则参照测验(目标参照测验);按“测量内容有:

成就测验、能力倾向测验和人格测验;按实施时的人数有个别测验(IndiviudTests)和团体测验(GronpTests);按测验材料有语言或文字测验(LanguageTetes)和非语言测验或称操作测验(Nonlanguagatests);按测验要求分(时限和难度)有速度测验(Speedtests)和难度测验(PowerTests)

此外,学业评价还有评语、观察量表、自陈量表、实验对照组分析等评价工具。

众所周知,在学校课堂教学管理中,课前的教案、上课的情况、作业和测验(布卢姆曾指出“作业”也是形成性评价的日常工作)是三个主要环节。

这里就作业或测验而言,学校教务管理者在记述、存档和开展评价的工作中,必须关注的是下面几个问题:

首先是明确校内学业评价或测验在教学管理的地位和作用。

这与管理者正确的教育观、知识观和学生观是分不开的。

一般认为,“校内考试(即这里讲的学业测验)或教师自编测验在本质上是对教学过程的模拟,是与教学实践同构的。

”葛大汇《学业考试与评价的几个基本理论问题》,《中国考试》1997年,第5期。

其对教师改进教学方面,具有确定教学目标的正确性和可及性,确定教学材料的可用性,确定教学方法的有效性,确定特殊的教学工作和途径(如对有困难的学生的某种补救),确定教学环境的优劣性等作用。

对促进学生学习方面,具有确定学生是否达到预期的教学目标,提供近期努力的方向,诊断学习错误并找到克服困难的方法,检测学生学习的进展提供反馈信息,确定学生的能力、兴趣、态度,选择今后的学习任务等作用。

为此,内容效度,即试题取样对所欲考察的学科教学内容和水平的适当性,是校内考试的首要原则。

学校和教师所设计的考查目标应该主要针对某个或某些单元的具体要求、学科教学大纲的部分要素和正在实施的教学计划,而不是针对外部的效标(譬如升学考试的目标)。

唯有这样,测验才能及时提供反馈信息,切实提高教学质量。

如下图所示:

【图学业评价或测验在在教学管理中的地位和作用】

准备教学目标

评价预期结果

改进教学与学习

评定成绩并向家长、社会报告

评价结果用于其它教育目的

为学生提供相关的教学

1.监测学习的进展

2.诊断学习困难

预测学生需要

第二,要备有学业测验的“目标双向细目表”(或称“测验蓝图”)。

细目表是评价测验编制所依据的指标体系,它是由预先规定的教学目标决定的。

所谓“双向”,其一个维度是表明我们所欲测量的学习内容即知识点、能力点是什么,另一个维度是表明该内容应该达到什么样的学习水平或难度水平。

在当前课程改革的标准中,学科学习的“态度”、“价值观”被认为是一个新的评价维度。

细目表既是指标体系,就有权重的设计,根据权重可以分配试题的难易程度和题量的大小。

对校内测验而言,一般“试题应该相对集中,每一考查项目要有足够的题量,以保证测验的可靠性(信度),而不是任意拼凑,扩大覆盖面,形似面面俱到,其实是‘蜻蜓点水’反而模糊了考查意图(当然这样说并不排斥期末年末的终结性考试和课程结束时的会考)”;也“不要随意提高难度,严格地说,校内测验属于水平测验不存在难度设计的问题,难与不难是各科课程标准和教材业已确定了的结果,不是人为拔高或降低的,这样才能使之真正成为改进教学的手段,发挥形成性评价的教育功用。

”同上。

第三,测验(试题)的编制与选择要规范、符合测量上的基本要求。

这个问题,随着目前日益泛滥的“试题集”而愈显严重,一方面很多学校发现青年教师逐渐丧失了命题的能力,他们习惯套用现成的试题;另一方面,一些试题集在商业运作的影响下,粗制滥造,并没有恰当的“为教学配套的作用”。

我们知道,在学校作业与测验的管理中,选择与编制的根本质量是追求学业评价工具的高效度与信度。

阿纳斯塔西(A.Anastasi)曾指出作业或测验“是行为样组的客观的和标准化的测量”,尽管校内学业评价主要使用的是教师自编测验,而不是标准化测验,但无论是管理者还是教师了解标准化测验并以此来提高自编测验的质量是必须的。

标准化测验的定义是由专家编制并具备信度、效度证据的测验。

一般具有如下几个特征:

①测验的目标、试题的使用、施测和评分解释等全部程序都有详细地规定,无关因素受到控制,以确保测验成绩的差异是唯一的自变量即考生的知识能力及人格特征造成的。

②试题的题型尽可能采用客观题,即使使用主观题也有非常明确的评分标准。

③试题的选取除了具有质量的要求外,还有难度和区分度的说明。

④试题的取样范围广且有足够的代表性和数量以增加测验的信度和效度。

⑤给出标准样组的测验常模从而给分数解释提供参照点。

显然,这些对一所学校的测验管理具有指导意义。

第四,在教学管理中必须对测验进行解释以改进教学。

这个问题是容易理解的,但是在日常教务管理中去常常被忽视。

其中,在利用作业和测验分数对学生的学习状况和教师教的状况进行评价时,采用什么标准类型也是非常重要的问题。

我在“准则标准”的论述中,我们已经讲到校内评价主要目的不是为了比较个体之间的差异,而更倾向于每个个体与既定标准的比较,因此校内学业评价在本质上不是那种与团体平均值进行比较的“常模参照测验(Norm-referncedText)”而是“准则参照测验(Criterion—referenledTest)”。

准则参照测验理论根据是:

学习成绩只有与预先规定的学科教学目标对照才有确定的意义。

因此它要求对测验编制必须严谨地分析所考查内容的全部的知识技能和学习水平的“目标小格”;在对测验结果进行解释时,把达到教学要求的某一水平算通过,没有达到就不算通过(而不象常模参照测验那样把各试题得分加总,只关心与团体的比较),并以学生在各个目标小格上的完成数量或百分比来判断优劣的(而不象常模参照测验是以平均值为参照点)。

当然,分析各目标达标情况与跟常模比较,这两种方法经常是关联的,相互依赖的,但在总体上,校内作业和测验更关注分析诊断的作用,以反馈信息改进课堂教学。

校内测验的职能可参见下表1:

【表1校内各类测验的属性与参照标准】

测验性质

配置性

形成性/诊断性

终结性

常模参照

准则参照

入学统考

平时测验

期中考试

期末考试

毕业会考

竞赛性测验

3、如何测评学生情感的案例

对学生在非认知领域的评价,当然包括体育评价,但在我国“非认知因素”的概念中主要指道德品质的评价(即德育评价)和个性心理的评价。

在我国当前课程改革的背景中,如上文所述,有“认知领域”与“非认知领域”教育相结合的趋势,而在道德及心理品质评价中有从关注“政治思想内容”的评价转向关注学生“情感发展过程”的评价的趋势。

显然,这是我国社会发展、变迁对教育评价学的要求。

概括地说,在德育领域,实际上还没有成熟的、较为直接的评价与测量的方法,一般对学生品德的管理与评价往往采用行为操守的定性陈述,评语从鉴定式的,渐渐转向更具有“人情味”的描述,这也可以说明,对人的评价并不可能完全迷信“定量”的方法,定性描述仍然是主要的方法;而在心理特征的评价方面,现在使用的主要还是传统的有关“情感好恶”、“行为倾向”或“人格倾向性”的态度量表,著名的有塞斯顿的态度量表、利克特量表等等,也有大量的为具体调查任务而制订的专门的心理量表,例如为调查儿童对学校课业负担而设计的《儿童一般焦虑量表》、《儿童测验焦虑量表》等。

提请读者注意的是,上面分别论述的品德评价和心理态度评价的两个方面,在实际评价学生的状态时是相互交融的,任何态度的基础是对事物的认识,而人的道德品行又影响着人个性特征与心理。

目前关于学生“情感领域”的评价理论与技术,最为人推崇的是前面提到克拉斯奥尔和布卢姆提出的“教育目标分类学”,该目标学认为学生情感发展的内在连续体是:

可引导的在愿意或注意基础上的“接受(Receiving)”;对情感刺激所作出的各种固定“反应(Responding)”;通过日益内化而逐渐形成的始终如一的“价值的评价(Valuing)”;针对所遇见不止一种价值有关的情景而将各种观念联系起来的“组织(Organization)”;最后,达到“由价值或价值复合体形成的性格化(Characterizationbyavaluecomplex)”。

D.R.克拉斯奥尔B.S.布卢姆《教育目标分类学第二分册情感领域》,施良方等译,华东师范大学出版社1989年版,第3页-195页。

显然,该研究与目前我国新一轮课程改革标准中强调学生学习的“价值倾向”、“态度”和“学习内部动机”的目标是息息相通的。

下面是一则应用实例。

【案例作文学习中的情感因素】葛大汇《作文学习中的情感因素》,《上海教育科研》1995年第11期。

情感与作文学习的密切关系,比如凝聚在一般兴趣爱好、态度中的价值意识,适应性和自我倾向等,对于作文学习是有着极大影响力的。

本研究从上海市南洋模范中学选取了四个班级的学生,其年龄变元为:

预初(小学六年级)、初一、高一、高二四个祥组;其学业成绩差异变元为:

“优生”、“差生”两段;有效总样本160人。

这样设计预示着在发展连续体中解释一些新的发现。

①作文情感因素的获取采用心理投射测验的作法,引发学生有关“写作文”的适应性、满意程度、需求和动机方面的陈述。

②根据“投射测验”归纳情感项目,制成自陈问卷,如下表(部分)。

③对自陈问卷的22个变量(这些项目的分数,其中反面陈述倒记分即被试选“4——最同意”的记成“1”)进行因素分析,考查它们聚合之后的负荷量以及结构关系。

前三个因素负荷量较大,因素F1主要是关于“作文学习的适应性”问题,因素F2是关于“外在的或者由教学而形成的价值准则”问题,因素F3是关于“价值的自我倾向”问题。

摘要见下表2:

【表2各公因素包含的主要变量(情感项目)及其负荷量】

变量(项目)

负荷量

因素F1

[○九]大量的不记分的“小练笔”象石头压在我的心头

[○七]大量的不记分的“小练笔”可以想法去应付的

[一九]动笔之前时常有“逼我写”的情绪

[一七]上一篇作文行低分会使下一次作业失去信心

[二七]用第一人称“我”写,实际写的是他人

.65950

.61037

.59967

.52811

.31109

因素F2

[三一]象范文那样的用词和写法是愉快的

[一一]行文时想到老师教我怎样审题、选材、开头等

[○一]在范文中学习遣词造句、选用素材等经验

[一三]老师反复讲的是因为有重要经验和教训

[二一]既要写在本子上就要让老师看得过去

.56342

.50975

.40300

.35254

.34062

因素F3

[三二]行文时我常想打动或说服读者和老师

[三○]我讨厌的是作文有时间或命题限制

[○三]我希望在范文中看到文章得到好评的原因

[○五]自己出题跟老师命题一样难在确定题意

[一八]老师的“印象分”对我影响不大

.54475

.50575

.40882

.38072

.38072

④结果分析(摘要):

从预初组到高二组“适应性”大体呈逆减趋势!

(这一现象与丹尼斯.蔡尔德[DennisChild,1977]《情感对学习成绩的影响》中,利用“R.B卡特尔16PF”量表所得到的,学生在人格方面呈“年龄倒置”的结论是相通的)。

见下表3:

【表3适应性因素项目总积分与标准差(经Z检验差异极其显著)】

适应性因素

预初初一高一高二

(n=40)(n=40)(n=40)

总积分均值

标准差

13.0813.1312.3511.45

2.202.142.552.25

然后,将在上述项目中的得分与学生在校作文平均分数进行相关计算(表略),发现:

高中组写作成绩与这些项目的相关程度要比初中组、小学组(预初)高得多,也就是说这些项目对高中组要敏感得多。

结合前“投射测验”的陈述,可见行将考大学的高中生的学习状态:

他们当中很多人感受到学习作文如负重磐[○九],把大量的不记分的作文练习看成是“苦役”,但同时又自觉把这种“题海战术”作为强化对策。

在这种应试情景中,教条式的禁忌(教学管理中所灌输的“端正态度”)抑制了写作所应有的心态,是情感方面反教育的事实,应该引起教师重视。

此外,本研究还对“外在的价值准则与自我倾向”进行分析,结论相似。

4、“多元智能”倡导下的情景化评价

“多元智能”作为教学论思想以被人们广为熟知,在评价上,学校管理者首先应该认识到多元智能所倡导的“情景化评价”(也可称为多元化评价)的民主价值,即把学生对象看成是具有丰富潜能的、发展的并拥有展示自己权力的主体人格的观念。

“多元智能”的首创者加德纳(HowandGardner)说“我将评价定义为为获得个体技能和潜力等信息的过程”,其目的是为个体和社区提供有益的帮助,或者说是为人们获取“智力公正”的手段;而不是“考试社会与学校教育的统一的观点”——即在实行一元化的相同课程的前提下,用客观的、非真实情景的测量方式给学生分等、分流的所谓正规考试。

加德纳(HowandGardner)《多元智能》,沈致隆译,新华出版社1999年版,第168页至183页。

在前述学生评价乃至更广阔的评价发展史上,我们看到,传统的评价将学生的学业考试仅仅看成是比较和控制的工具,评价的资料主要用于“在教程结束时”,对教学效果与预先由国家颁定的统一目标进行“一致性”检验(泰勒模式)B.S.布卢姆等著《教育评价》,丘渊等译,华东师范大学出版社1987年版,第35页。

,表现了科学主义管理的“效率”思想。

大约自上世纪70年代以来,人们开始对评价的意义和职能发生了怀疑,人们意识到在我们聚焦于目标的时候目标本身应该被评价,“看看这个目标是否适合社会的需求,并得出预期结果的决策”(斯塔弗尔比姆L.D.Stufflebeam)瞿葆奎主编《教育学文集教育评价》华东师范大学出版社1988年版,第309页。

”,而属于教育的评价应该更加注重“形成性评价”的职能(前已有论述),在真实的学习和生活的情景中,甚至在“游离于目标之外”(goalfree)的情景中,去关注每一个“单个的学生”的情感、道德陶冶、学习权力和整个生涯幸福的发展。

这在管理上,可谓是一种倾向于多元价值的“人性”化的思想。

正是在这样的管理思想下,情景化学生评价的改革在美国、英国等发达国家中兴起。

情景化学生评价是指不依赖单纯的标准化测验,而是运用多种途径,在非结构化的自然情景或文化背景中,重视学生发展的过程,以帮助学生展示其成功智力和学习结果的一系列评价方法。

因此,情景化学生评价,可以看作是继“形成性评价”哲学之后,现代评价思想与模式的集合体。

本书把时下以比尔.约翰逊(BilJohnson)为代表的“档案袋评定”、“苏格拉底式的问题研讨”、“展示或展览评定”等等评价设计,看成是情景化评价的手段。

具体而言,学校管理者应该了解这种现代评价的如下特征:

第一,“评价胜于考试”要为学生谋取智力公正。

基于上面的评价定义,人们越来越认识到,传统的考试使得学生从入学的第一天起就开始了为免遭淘汰而进行一次次的决斗,它的作用“往往用来找出人的弱点而非长处”。

而多元评智能及其评价之所以强调(包括传统考试所热衷的语言和数理逻辑智能)我们每一个人至少有七种智能乃至更多的“珍贵潜能”,不同的人由于不同的优势智能和弱势智能的组合在不同的学习环境中表现出不同的学习效率;卡洛尔与布卢姆(J.B.Carroll&B.S.Bloom)进而指出,学生掌握学科任务的水平关键在于花在学习上的时间,例如“一项国际教育成绩研究发现,12个国家中13岁学生花在家庭作业上的时数,比率大致是6:

1,这就是说,一些学生作业的时间是别人的6倍”施良方《学习论》,人民教育出版社,1994年版367页。

而之所以强调这些个性特征与时间差异其目的就是为了号召学校教育必须尊重这样的事实,因材施教,从而“能让学生发挥出他们的长处、表现出自己的最佳水平”加德纳(HowandGardner)《多元智能》,沈致隆译,新华出版社1999年版,第176页。

正象斯腾伯格(R.J.Sternberg)所言,成功不仅仅是伟人、巨匠的专属,它也会随时垂青于在现实生活中找对自己位置的平凡人。

斯腾伯格(Sternberg,R.J.)《成功智力》,吴国宏等译,华东师范大学出版社,1999年版,第11页。

第二,在“情景中”或在学以之用的目的中开展评价。

加德纳指出评价与(传统)考试的差别在于,评价“偏爱从日常表现中提取信息”,而考试采用“中立的、非情景化”的方式往往是人陷入学习危机。

缘此,情景化评价“希望能够开发出一种环境,甚至是一种社会,使个体先天或后天具有的智力强项能够显现。

在这个环境里,个体在日常问题的解决和作品的创作中,能够清楚地表明他们自己最适合担任的职业或副业的角色。

”加德纳(HowandGardner)《多元智能》,沈致隆译,新华出版社1999年版,第190页。

例如,学习数学的学生应该能够作出合理的投资计划,搞清抵押贷款和保险的各项原则,填写他们的退税单,而学习历史的学生能够解释当前发生的事件或预测未来的可能性。

第三,在发展中为帮助学生而开展评价。

现代学生评价中与“情景化”相联系的另一个侧面是它的“发展观”,这是先前形成性评价思想的延续。

它带来这样一场运动:

从教师中心、内容驱动(content-driven)的课程转到学生中心、探究驱动(inquiry-driven)的课程。

它向众人“提供一种如何开发评定的感觉,并理解表现评定是一个不断进步的工作,即“评定是教与学过程的一部分”。

比尔.约翰逊(BilJohnson)《学生表现评定手册场地设计和前景指南》,李雁冰主译,华东师范大学出版社2001年版,第7页至第8页。

同时,推动教师、管理者去检讨老式的评价标准。

第四,“对个体差异、发展阶段和知识形式高度敏感”加德纳(HowandGardner)《多元智能》,沈致隆译,新华出版社1999年版,第183页。

这是上面几条特性的具体表现。

第五,采用多种测验和评价的方法。

例如“直接的评价”、“操作评价”、“真实性评价”、“历程档案评价”、“动态评价”等等。

其学生提供的成果或作业可以是(改造过的)测验结果,短文(essay)、写作(writing)、口头演说、展示(exhibition)、实验、作品选等等。

一些成果还要求备有学生反思、成长和现状的记录。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 预防医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2