基于数据的增值评价理论探索及实证研究Word下载.docx

上传人:b****2 文档编号:5034264 上传时间:2023-05-04 格式:DOCX 页数:21 大小:1.67MB
下载 相关 举报
基于数据的增值评价理论探索及实证研究Word下载.docx_第1页
第1页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第2页
第2页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第3页
第3页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第4页
第4页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第5页
第5页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第6页
第6页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第7页
第7页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第8页
第8页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第9页
第9页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第10页
第10页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第11页
第11页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第12页
第12页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第13页
第13页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第14页
第14页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第15页
第15页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第16页
第16页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第17页
第17页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第18页
第18页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第19页
第19页 / 共21页
基于数据的增值评价理论探索及实证研究Word下载.docx_第20页
第20页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

基于数据的增值评价理论探索及实证研究Word下载.docx

《基于数据的增值评价理论探索及实证研究Word下载.docx》由会员分享,可在线阅读,更多相关《基于数据的增值评价理论探索及实证研究Word下载.docx(21页珍藏版)》请在冰点文库上搜索。

基于数据的增值评价理论探索及实证研究Word下载.docx

标准分之所以打引号,因为很多人忽略了一般标准分使用的前提:

数据一定是呈正态的才可以,这是基本常识。

不同学科的学业测试的标准分只有在分布形态相同或相近的情况下才能进行比较,如果两个分布的形态不同,譬如一个是正态,一个是负偏态,那么相同的Z分值可能代表不同的百分等级。

对于这样的两种分值,我们难于做到准确地比较。

“当若干个测试的分布形态不同时,它们的偏态“标准分“既不可以相互比较,又不可以相加求和。

2.标准正态分布形态

●为了使不同的测验分数可以相互比较,则需将之正态化,即使用进行过非线性转换的“正态化标准分”。

如图所示,非线性转换的结果是把偏态分布强制扭转成为标准正态分布形态。

●正态标准分

可以实现对不同学科考试分数的对比,同学科或不同学科综合,也可以确定学校、年级、班级

或考生个人在总体中的位置。

在正态标准分前提下,不同科目和不同考试之间的成绩完全具备可比性,通过多次考试成绩对比可为学校教育教学提供客观测评,做到统筹管理。

3.数据正态化的方法

●计算公式

我很荣幸得到了上海普教研究所陆璟老师推荐的考分数据正态化公式∶

●计算步骤

L,F分别为该原始分数所在组的下限和次数;

Fb为下一组的累计次数;

J为组距;

m为标准化样本的容量。

是把分数在一个假定正态分布总体中的相对位置反应出来。

X为原始分;

通过正态分布表,查出百分等级PR相应的z值:

Z=PR-0.5其中0.5*是修正值。

注意这个修正值的确定应该符合下述的等第划分规则。

●等第划分

指标

代号

公式

占人数百分比

等第划分1

(控制D,E档学生为21%)

A

Z≥1.6

0.054%

B

1.6<z≤0.8

0.157%

C

0.8<z≤-0.8

0.576%

D

-0.8<z≤-1.6

E

-1.6>z

等第划分2

(控制D,E档学生为27%)

Z≥1..8

0.035%

1.8<z≤0.6

0.238%

0.6<z≤-0.6

0.452%

-0.6<z≤-1.8

-18>z

4.统计正态标准分的突出意义

一是可以建立学生档案,使得学生的进步或退步情况可以纵向比较,做到胸中有数。

二是可建立学生发展性评价数据库,以便利用学习分析技术,精准分析教学瓶颈,预测教与学的未来趋势,确定预期的目标。

考虑到不同学校规模,在学校范围内进行正态标准分统计只统计到学生个体。

5.衍生的分析指标

【班级T分平均值】

采用计算班级单科、多科的学生标准分(或T分)的平均值进行比较,其功能在于比较学校内各班级群体的位置,既可以横向比较又可以纵向比较。

【进步率】

其功能在于让班级多门学科老师组成的团队,协调一致形成合力,共同促进学生的进步。

不计负值的作用是避免其他因素干扰。

功能:

促使团队加强横向联合,引导“跳棋思维”,突显双赢、互赢的理念,互相搭桥,互相前进,互相成长发展。

充分发挥评价在整体教育过程中的作用,进一步理顺自身评价工作与教育评价机构的关系,建立为整体教育服务的观念。

在大评价观的指导下,将自身的评价工作与教育评价的工作形成互补。

目的是研究并促进形成科学、完整的教育评价标准和体系,完善健全良性的工作机制。

【增长值】

采用计算班级单科、多科的学生标准分(或T分)的平均值进行纵向比较。

功能之一:

是设置了初始基准。

由于学校内不同层次学生的基础是不一样的,因此在入学初(时间结点)进行一些摸底是必要的,如中考、摸底测试等。

在定初始基准之前,可以把以前3~5年的原始分进行一下平均,以抵消个别年份的难度波动,然后以这个平均值作为基础计算其成绩水平(标准分),才可作为初始基准。

功能之二:

为解决进位存在基础差容易进位,基础好难进位的情况,设置了权重。

根据T分区间赋予权重系数来处理高端不易进步的问题。

考核记分设置进位系数,按权重系数选取。

基准分的划定只用一个即可,因为多个基准干扰因素太多,中间过程太复杂。

而一个基准相当于一个海平面,且入口出口始未两态容易对比。

就某一学科而言,可以分析考生掌握学科知识和能力的情况,这对于改进教学,提高学习能力和水平具有很大的促进作用。

另外,可以利用考试数据进行跨年度的比较,从而了解教育、教学的发展趋势。

【等级划分】

为了科学地区分学业成绩的等级,在正态分布的基础上按Z值分成A、B、C、D、E五个等第,可以简要明确学生大致的位置,也便于了解学生的分布情况。

上述测评指标在实际过程性评价操作中得到验证:

●教师所任班级单学科总体学习水平的纵向比较考核(增长值)生成报告样例(考核分100分)

教师姓名

班别

人数

学科

初始

平时

 

期中

期末

 增长值

考核 

班T分

均值

△T10

△T11

△T12

记分

卞二

高一⑴

38

物理

40.5

60

19.5

49.7

9.2

48.7

8.2

70.4

李四

高一⑵

47

50

3.0

13

80

33

85.7

王二

数学

48

49

1.0

51.1

3.1

46.7

-1.3

51.4

鹿三

56

0.0

4

24

71.6

说明:

考核指标

权重

记分公式

增长值

△Tab

按权重系数图选取

R*+△T10*X1+△T11*X2+△T12*X3

X1、X2、X3为进位系数在以下权重系数图中择取,R*为常数,上表中可以取R*=50

权重系数图

公式:

班平时T分均值-班初始

x

班期中T分均值-班初始

班期末T分均值-班初始

△T20

△T21

△T22

平时班T分均值

取学期内各次平时测试班

分平均值

△T10、△T11、△T12与△T20、△T21、△T22的解释是一样的,两者的区别是△T10中脚标10表示高一年级(或一年级),△T20中脚标20表示高二年级(或二年级)。

●教师所任班级多学科总体学习水平的综合比较(进步率)考核生成报告(考核分100分)

班级

班级人数

首次进步人数

进步率

再次进步人数

平均值

班级综合(进步)记分

符号

n

n0

j0

n1

j1

16

0.42

20

0.526

0.47

47.4

0.53

10

0.263

0.39

39.5

说明

=首次进步人数n0/班级人数n

ji

=再次进步人数n1/班级人数n

=Σ(j0+ji+…)/i

=100*

备注

j0是在初态测试时,以班级多学科综合分为基础,计算的进步率。

进步人数n0的确定方法:

在初态测试时,计算班级每个学生的多门学科

综合分(设为p0);

将后继测试时,计算班级每个学生的多门学科综合

分(设为p1)。

然后把差值按公式:

△p=p1-p0算出,差值按大于等于

零(或某正值)计数即为n0。

(二)达标指数

1.对以下误区的分析

 

2.达标指数的理论依据

●达标指数

能够具体反映全体学生情况。

达标指数的理论基础是信息论及其关于相对熵的理论。

达标指数的主要功能在于能折射出样本学生之间存在的差异,又能表示样本学生群体对知识掌握的同步情况,其数值反映学生群体达标程度。

达标指数能把错综复杂的情况化为明确的能区分的定量分析数据,能总体反映教学达标程度。

当CP≥0.6时,学生群体相对课程标准或测试目标为基本达标程度。

采用达标指数,可发现某校群体的薄弱环节;

从试题的达标指数特征曲线,可比较区域内各学校群体的达标程度;

运用达标指数图象可分析教学问题,利于管理者提高教学监控质量,推动教师反思和进行有效教学。

达标指数的理论基础是信息论及其关于相对熵的理论

一级

二级指标

属性

意义

适用

范围

达成度

达标指数

CP

CP=(R-W)/N

比值

R为完全达标人数,W为完全不达标人数,N为总人数

班、年级、学科、各学科

达成率

D=CPi/n

教学过程的数次测评中,教学目标达成个数与试卷测试目标个数n比值。

达标率

η

η=Da/Ji

进行终结学业测评时,计算各学科教学目标达成个数Da与课程标准制定的教学目标个数Ji的比率η

●源于得分率却胜于得分率

举例:

得分率为0.80,以10个学生为群体的话,不能说明群体达标情况

●达标指数的评价标准

CP=0.6时,三种比率情况:

正确率、全错率和中间率(未全错学生人数与总人数比率)

上图所包含的区间有21个之多。

如此众多复杂的区间,用达标指数一个量就可以衡量了。

达标指数作为教学评测指标,那么它的运用功能与价值

(2)有哪些?

1.采用达标指数来分析题目,与识别指数BI(3),有根本区别,因为有负数(负差拍)。

达标指数用于考试测评分析,能折射出样本考生之间存在的差拍。

Cp>0,表示样本群体对知识掌握的同步情况,其数值反映考生群体达标程度。

Cp<0,表示样本群体对课程标准远离的差距,若试题统计出来整体存在负数且数值偏大,说明考生群体偏离课标有很大差距,教学中存在失误,应引起重视;

当达标指数为零,则表示二种情况:

要么命题存在问题,要么考生文不对题,张冠李戴,对概念或规律的内涵理解不清,运用失误。

从命题本身看,结合新课程标淮对照,命题有无不妥之处,否则只能是知识运用能力有待提高,需要引发教学反思。

2.采用达标指数曲线来分析题目,不同于试题特征曲线(4)。

如余民宁先生所说:

“任何一条试题特征曲线所代表的涵义是:

答对某一试题的机率,是由考生的能力和试题的特性所共同决定。

因此,试题反应理论(IRT)具有下列几项基本假设(单向度、局部独立性、非速度测验、知道——正确假设等),唯有在这些假设都成立的前提下,试题反应模式才能被用来分析所有的测验资料。

”“比如项目参数估计的不变性,根据IRT,应该是不管抽取什么样组,项目参数都保持一致。

但事实上,IRT仍要通过某些数据去估计参数;

这些参数还是通过被试样组获得,不同的样组,测验数据就不同,据此估计的参数无法保证一致。

换言之,把任何一组测验数据输入计算机,用IRT的软件进行估计,并不一定能得出稳定的参数值。

而要得出稳定的参数值,其首要的条件是测验项目和模型拟合。

而拟合性指标又严重依赖于被试样组的大小,样组小,即使数据与模型有很大偏差,也难以检测出来。

由此可见,对IRT来说建立良好的模型与数据拟合是十分重要的。

另外,由于IRT又是建立在相当强的假设基础上的,因此对假设的检验就变得十分重要了。

各种模型都需要进行检验的一条假设是单维性检验。

恰恰在单维性问题上,IRT承受着来自理论上和实际应用方面的巨大压力,学者们对此存在尖锐的不同看法,既然被试的测验数据不仅仅由能力θ决定,还受测验时的多种内外环境的影响,比如心境、身体状况、环境气氛,甚至气候、照明等等,那么IRT要求的单维性假设就根本不能满足。

IRT对此采取的做法是,只要某种心理特质占主导地位,就算满足该假设。

从严格意义上说,显然是有缺陷的。

这也制约了IRT的发展及应用。

”(5)而达标指数无需上述假设,是由达标指数曲线本质决定,它是用数据说话,比较简明客观。

3.衍生的教学目标达成度指标

从微观角度看,由于绝对评价依据的是教学目标,是一种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。

三、教师专业发展的增值评价

●教师阶段性教学目标达成率生成报告

任教学科

任教年级

月考达成率D1

月考达成率D2

月考达成率D3

月考达成率D4

月考达成率D5

平时达成率平均值D平

期中达成率D中

期末达成率D末

记分Ⅰ

0.3

0.5

0.6

0.4

0.8

0.52

0.70

0.80

34.3

0.9

0.56

0.40

26.4

0.7

0.62

0.60

32.3

0.50

28

D=ΣCPi/n,其中ΣCPi为CP≥0.6的教学目标达成总数,n为测试目标总数。

为所有平时月试或抽检等多次达成率的平均值。

权重分配为:

(平时达成率平均值D平*30%+期中达成率D中*30%+期末达成率D末*40%)*50

●教师教学计划达标率生成报告

测量目标

实际达成

记分Ⅱ

18

0.90

45

19

0.95

47.5

1.00

30

0.33

16.7

η=Da/Ji其中Da为实际达成教学目标个数(默认为ΣCPi),Ji为学期初计划达成教学目标个数即试卷上体现的测量目标。

达标率*50

●教学目标达成度考核指标总得分生成报告

记分Ⅲ

79.3

73.9

82.3

16.7

44.7

●教师增值评价总计分生成报告

单科增长值评价得分

班级进步率评价得分

达成度评价总得分

第一学期

第二学期

合计

70.4

47.4

79.3

197.1

85.7

39.5

73.9

199.1

51.4

82.3

181.1

71.6

44.7

155.8

教师专业发展的增值评价=单科增长值评价得分+班级进步率评价得分+达成度评价总得分。

由此可见,教师专业发展的增值评价是以学生的学业成就和整体发展水平的提高作为评价依据,通过相关的统计分析技术,将教师对学生发展的影响从诸多相关因素中分解出来,从而实现对教学效果“净”影响的评价。

参考文献:

⑴边玉芳,孙丽萍:

《教师增值性评价的进展及在我国应用的建议》,教师教育研究:

2015,01:

89。

⑵冯虹张莹:

《增值评价:

基于大数据的发展性教育评价模式》,当代教育科学:

2016,09:

29-30

⑶雷新勇:

大规模教育考试命题与评价,上海:

华东师范大学出版社,2006:

159-164。

⑷周炯槃:

《信息理论基础》,人民邮电出版社,北京,1983。

⑸俞晓琳:

《项目反应理论与经典测验理论之比较》,南京师大学报:

社科版1998,04:

74~77

2021年8月17日

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2