完整word学生成绩分析模型.docx

上传人:b****7 文档编号:16491400 上传时间:2023-07-14 格式:DOCX 页数:25 大小:71.34KB
下载 相关 举报
完整word学生成绩分析模型.docx_第1页
第1页 / 共25页
完整word学生成绩分析模型.docx_第2页
第2页 / 共25页
完整word学生成绩分析模型.docx_第3页
第3页 / 共25页
完整word学生成绩分析模型.docx_第4页
第4页 / 共25页
完整word学生成绩分析模型.docx_第5页
第5页 / 共25页
完整word学生成绩分析模型.docx_第6页
第6页 / 共25页
完整word学生成绩分析模型.docx_第7页
第7页 / 共25页
完整word学生成绩分析模型.docx_第8页
第8页 / 共25页
完整word学生成绩分析模型.docx_第9页
第9页 / 共25页
完整word学生成绩分析模型.docx_第10页
第10页 / 共25页
完整word学生成绩分析模型.docx_第11页
第11页 / 共25页
完整word学生成绩分析模型.docx_第12页
第12页 / 共25页
完整word学生成绩分析模型.docx_第13页
第13页 / 共25页
完整word学生成绩分析模型.docx_第14页
第14页 / 共25页
完整word学生成绩分析模型.docx_第15页
第15页 / 共25页
完整word学生成绩分析模型.docx_第16页
第16页 / 共25页
完整word学生成绩分析模型.docx_第17页
第17页 / 共25页
完整word学生成绩分析模型.docx_第18页
第18页 / 共25页
完整word学生成绩分析模型.docx_第19页
第19页 / 共25页
完整word学生成绩分析模型.docx_第20页
第20页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

完整word学生成绩分析模型.docx

《完整word学生成绩分析模型.docx》由会员分享,可在线阅读,更多相关《完整word学生成绩分析模型.docx(25页珍藏版)》请在冰点文库上搜索。

完整word学生成绩分析模型.docx

完整word学生成绩分析模型

学生成绩分析模型

摘要

本文依据数理统计的知识为基础,结合统计分析有关方法,针对大学学生成绩的显著性分析、课程相关性分析和课程增减管理问题,在充分合理的假设条件下,建立了相应的检验和分析模型,并经过多个软件的辅助计算和分析,经过深刻讨论和综合评价,最后给出了学校课程增减的具体方案,很好的解决了相应的问题.

首先,对于问题1用EXCEL求出所给学生每学期的平均成绩,然后根据查资料所得学生成绩总体服从正态分布这一结论,我们做出样本均值假设,构造t统计量,利用数理统计中的假设检验原理,并用SPSS计算出结果为:

该专业学生的成绩在不同学期显著,即不是显著性不同。

接着,对于两个班学生成绩的显著性,对每个学生的七个学期成绩求平均,即将原始数据分为班一和班二两个样本,对于这两个样本我们利用EXCEL中的样本等方差和等均值检验,对两个班的成绩进行检验分析,结果显示:

两个班的学生成绩是显著性不同。

其次,针对问题2,根据题目所求A、B、C类学生成绩的相关关系(即是否显著性相关),我们在问题1的基础之上,通过EXCEL得到了A、B、C三类学生成绩平均成绩,通过SPSS的相关分析,我们初步得到了A、B、C存在显著相关的结论。

接着,我们没有直接选用传统的简单相关性分析法对于A、B、C具体的相关程度分析,而是选择了典型相关性分析法,通过MATLAB的辅助计算,最终我们得出A、B、C三类课程的相关程度,得到了如下结论:

(1)A类课程对B类课程有显著促进作用,

(2)B类课程对C类课程有显著促进作用,

(3)A类对B类影响与B对C影响程度相同

接着,对于问题3,在问题1和2的分析和讨论之下,利用SPSS软件对各学生各科成绩进行了偏差分析,并结合直方图比较,再综合A、B、C类课程的重要程度以及相互影响,我们给出了学校每类课程可减的具体方案:

A类可减课程:

A11、A4、A2;

B类可减课程:

B10、B12、B8、B17、B16、B18;

C类可减课程:

C13;

最后我们对建立的模型优缺点进行了分析,并说明了该模型在实际生活中的推广和应用,为学校对学生成绩的管理和课程设置的管理等有关方面的决策者具有一定的指导意义。

 

关键词:

显著性检验典型相关分析偏差分析

 

一问题重述与分析

1.问题重述:

学生成绩分析

在某大学,某专业的大学课程分为三类:

公共基础课(A类),专业基础课(B类)和专业课(C类)。

现将该专业某年级的大学成绩汇总在附表中。

为了某些需要,仅保留了学生学号,和课程标号(如:

A2表示公共基础课中的第二门课程,B15表示专业基础课中的第15门课程,其他类似).

就附表中的汇总成绩,试建立相应数学模型解决下面问题:

(1)试分析该专业的学生的学习成绩在不同的学期是否显著性不同.两个班学生的学习成绩是否有显著性不同.(学号1-30为一班学生;31-62为二班学生)我们的理解是:

一般学生的成绩总体服从正态分布,此处判断显著性是不是相同即对样本中的数据进行显著性检验。

(2)学生的A类、B类、C类课程的成绩是否显著性相关。

若是,分析A类课程成绩对B类课程成绩,B类课程成绩对C类课程成绩的影响程度.我们的理解是:

通过某种分析找到A类、B类、C类课程之间的相关方程,并求出相关系数,以分析不同类课程之间的影响程度.

(3)考虑到该专业的教学负荷较重的原因,现计划减少开设的课程门数.由于较难课程的学生成绩整体偏低,较易课程的学生成绩整体偏高,而不同学生的成绩偏差不大,故计划减少学生成绩整体偏差不大的课程(该要求不一定合乎实际)。

试给出调整后开设的课程名称(用附表中的代码表示).

我们的理解是:

不同课程科目,对应的学生成绩,并不一定服从正态分布,所以导致有几门课程偏离正态分布比较大,即学生成绩整体偏差比较小(相对集中于中间),对于此类课程可以在下期计划中除去,以减少该专业的教学负荷.

2.问题的分析:

对于问题1,首先用EXCEL对题目中提供的数据进行统计和分析,计算出62个学生每学期的平均成绩,即定为该学生这学期的最终成绩。

这样得到七组学生成绩数据,对应不同学期是否有显著性不同,我们经查阅有关资料得知:

学期学生成绩的总体服从正态分布。

因此,我们对得到的学期成绩样本进行均值假设性检验,利用数理统计中的显著性分析原理,对应总体均值和方差均未知的正态分布构造t统计量,借助SPSS计算出检验的结果即可。

对于两个班学生的成绩,我们在学期平均成绩基础之上,对每位学生的学期总成绩求均值,这样以班为单位将数据分成两组,对应这两个分别来自同一个总体的样本,我们对其进行等方差和等均值分析,借助SPSS同样可得出结果。

对于问题2,利用同1一样的初始数据处理方法,得到每学生A、B、C三类课程每类的平均成绩(不考虑学期与学期之间的影响),研究三类课程之间的相关关系,很容易让我们想到用相关分析法,然而常规的相关分析法只能得到对某类课程某门科目对某类课程某门科目的关系,即点对点的分析。

于是,我们通过查阅资料和方法比较采用了典型相关分析法分析此问,最后根据得到的样本典型变量和相关系数,从而分析出三类课程之间的相互影响关系。

对于问题3,我们没有选择平均成绩进行分析,而是直接对每门课的62各学生成绩进行标志变异指标分析,进而对该门课的成绩是否服从正态分别做出判断。

最后结合问题2的结论,综合给出了有关课程增减的调整方案。

二模型假设和符号说明

3.模型的假设:

(1)题目提供的相关统计数据真实可信;

(2)公共基础课、专业基础课和专业课重要性同等;

(3)学生与学生之间的成绩相互独立,同一学生同一类课程不同学期之间的成绩相互独立;

(4)不同类课程之间存在影响,不同类课程的不同科目之间也存在影响;

(5)学生的某学期平均成绩能够较好的反应学生的综合成绩;

4.符号的说明:

其他符号在模型中运用时再作说明.

三模型的建立与求解

5.问题1的模型建立与求解

假设检验原理:

设学生成绩的总体

其中

已知,矩阵

未知。

从总体中随机抽取的n个样本(X1,X2…Xn).检验其均值与总体均值的显著性差异步骤如下:

1)作统计假设

2)引入统计量

(T服从自由度为n-1的t分布)

3)对于选取的显著水平α,查T分布表,求出能使

满足的临界值

4)由样本中的学生成绩技术出引入的统计量T值,并和临界值

比较,如果

则拒绝假设

;反之,则接受假设

通过查阅资料,我们得知:

学生的成绩总体服从正态分布,我们对附表中的数据,现用EXECL对每位学生的学期成绩求平均,并以此代表该学生当前学期的综合学习成绩,求得每学期的62名学生的总平均成绩为:

75.94

80。

06468

76。

50452

78.65081

76。

24242

77。

82435

77.86371

依据上面讲述的均值假设检验原理,结合上面的样本均值,利用SPSS求得结果如下:

表1显著性检验

单个样本均值检验

检验值=0

差分的95%置信区间

t

df

Sig。

(双侧)

均值差值

下限

上限

第一学期

105.411

61

000

75。

93750

74。

4970

77。

3780

第二学期

121。

681

61

000

80.06452

78。

7488

81。

3802

第三学期

124。

937

61

000

76。

50538

75。

2809

77.7299

第四学期

126.688

61

000

78。

65054

77。

4091

79。

8919

第五学期

90.257

61

000

76。

24194

74.5528

77。

9311

第六学期

104.308

61

.000

77.82437

76。

3324

79.3163

第七学期

168.318

61

000

77。

86089

76.9359

78.7859

由上表得,Sig即为双侧检验的P值,在a=0.05的显著性水平下各学期的检验P值均为0,故可以得出结论:

该专业学生的学习成绩在不同学期不是显著性不同。

同样依于EXCEL的数据处理,求出每个学生七个学期的总平均成绩(即每个学期的综合学习成绩加和取平均)。

并根据该专业两个班的人数将其分成1-30为一组,31—62为一组,我们把每个班看作一个来自学生成绩总体的样本,这样两个班的学期总平均成绩即为来自同一总体的两个总体。

利用EXCEL进行等方差和等均值检验,结果如下:

表2等方差检验和等均值检验

F-检验

t—检验

1班

2班

1班

2班

平均

77.08138

78。

10387

平均

77.08138

78。

10387

方差

22.12164

15。

82306

方差

22.12164

15。

82306

观测值

29

31

观测值

29

31

df

28

30

df

58

F

1。

398063

tStat

—0.91128

P(F〈=f)单尾

0。

184617E—5

P(T<=t)单尾

0。

182961E-5

F单尾临界

1.854399

t单尾临界

1.671553

由表可知,等方差检验的F=1。

398063〈1。

854399(临界),等均值检验的t=—0.91128<1。

671553(临界),即等方差和等均值检验都通过了检验,这表明:

两个班的学生学习成绩存在显著差异,即显著性不同。

6.问题2的模型建立与求解

根据假设5,继续同样通过EXCEL计算出A、B、C三类的平均成绩,通过SPSS的简单相关分析,结果如下:

表3三类课程平均成绩相关性

相关性

A类平均成绩

B类平均成绩

C类平均成绩

A类平均成绩

Pearson相关性

1

1.000**

982**

B类平均成绩

Pearson相关性

1。

000**

1

982**

C类平均成绩

Pearson相关性

.982**

.982**

1

由上表,知A类与B类课程成绩的Pearson相关性达到1。

00,即高显著性相关,A类与C类以及B类与C类的Pearson相关性均为0.982,因此,我们得出结论:

A类、B类、C类课程的成绩是显著性相关的。

接着,我们继续探讨A类课程成绩对B类课程成绩,B类课程成绩对C类课程成绩的影响程度。

分析可知,A类课程由18门,B类18门,C类15门,而表3的结论告诉我们A、B、C三类课程存在显著相关性,却无法具体分析出三类课程之间的具体影响程度。

因此,通过问题分析中的阐述,我们没有选择只能实现“点对点分析”的常规相关分析法,而是选择能够把多个变量作为整体考虑的典型相关分析法。

A类与B类之间的典型相关分析:

通过EXCEL录入A类和B类各门课程的成绩,利用MATLAB(程序见附录1)求得公共基础可与专业基础课之间的相关系数矩阵.根据A和B的相关系数矩阵计算出A与B的典型相关系数如下:

表4A类与B类课程的典型相关系数

0。

925106

0。

858916

0.822559

0.815571

0。

806129

0.685395

0.655236

0.647002

0.575905

0.570048

0.491516

0。

353381

0。

250605

0。

198562

0。

157091

0。

146347

0。

087594

0。

034937

由上表可以看出,这十八门公共基础课所表示的变量与U1有大致相同的相关系数,U1可视为描述这A和B各十八门课程成绩的指标。

第一对典型变量的第二个成员v1与U1,U2,U3,…..U18有较大的相关系数,而1u和1v之间的相关系数0。

925106。

接着,利用MATLAB(程序见附录2)进行Bartlett检验来判断各个特征值对典型相关变量相关的显著性。

取a=0。

10,将检验统计量的观测值及卡方分布的上侧a分为数(临界值)及检验的结论列于下表:

表5典型相关性检验的结果

i

p_ab(ab的相关系数)

wi

ti

F(自由度)

临界值

结论

1

0.925106

6。

43E—05

410.197

324

357.0212

拒绝H0

(1)

2

0。

858916

0。

000446

320.172

289

320.207

接受H0

(2)

3

0.822559

0。

001701

258.2516

256

285。

3927

4

0.815571

0。

00526

207.2843

225

252。

578

5

0。

806129

0。

015708

159.9141

196

221。

7631

6

0.685395

0。

044859

116.409

169

192。

9477

7

0.655236

0。

084602

90.14776

144

166.1318

8

0。

647002

0.148251

67.76414

121

141.3153

9

0.575905

0.254995

47。

14467

100

118。

498

10

0.570048

0.381539

32。

2787

81

97。

67958

11

0.491516

0.565204

18.54346

64

78。

85964

12

0.353381

0。

745247

9。

262255

49

62.03754

13

0.250605

0.851592

4.899763

36

47.21217

14

0.198562

0.908658

2。

825692

25

34。

38159

15

0。

157091

0。

945954

1.583492

16

23.54183

16

0.146347

0。

969889

0。

840779

9

14。

68366

17

0.087594

0.991116

0.236474

4

7。

77944

18

0。

034937

0。

998779

0。

031144

1

2.705543

由于

被接受,故除第一对典型相关变量显著相关外,其余各对的相关性均不显著,因此只需考虑第一对样本典型变量即可。

采用采用典型相关变量标准化的系数来建立典型相关模型:

U1=0.377503*A1+0。

014677*A2+0.571906*A3+0.155517*A4+0。

268445*A5+0。

307846*A6+0。

689617*A7+0。

370431*A8—0.00342*A9-0.06*A10+0.390266*A11+0。

373579*A12+0。

306152*A13+0。

261455*A14+0。

36136*A15+0.699704*A16+0。

414401*A17+0。

200931*A18

V1=0.583261*B1++0.661098*B2+0。

6535*B3+0.658262*B4+0。

687234*B5+0.741421*B6+0.571651*B7+0。

101655*B8+0。

276085*B9+0.415182*B10+0.301296*B11+0。

409601*B12+0。

560322*B13+0。

499139*B14+0.29404*B15+0。

641194*B16-0。

09332*B17+0.320198*B18

其中Ai(i=1,2,3…18)和Yi(i=1,2,3…18)为相应的样本标准化变量

下面对(U1,V1)的实际意义给以解释,由于(U1,V1)的相关系数=0.9251,即U与V具有高度正相关关系,而U1和V1中各变量的权系数大部分为正(尤其是绝对值较大的权系数),因此一般来说,学好公共基础科对学好专业基础课具有促进作用,即公共基础课成绩较好者,他们的专业基础课成绩一般也较好。

进一步,U1中A16权系数最大,其次是A7、A3、A17,其他的则占的相对来说比较小样本的第一典型变量V1与B呈高度相关,说明在这么多成绩中专业基础课成绩占有主要地位。

根据第二组典型相关方程,V1中B6权系数最大,其次是B5、B2、B4、B16,而其他则占有相对来说比较小的比重。

由于第一组典型变量占有信息量比重较大,所以总体上公共基础课方面的主要因素按重要程度依次是A16、A7、A3、A17,专业基础课方面则是是B6、B5、B2、B4。

同理得出B类课程与C类课程的典型相关分析结论(有关MATLAB程序见附录3和附录4):

B与C第一典型向量(V2,W1)的相关系数=0.913456,说明专业基础课(即B类)对专业课(即C类)具有显著促进作用,从总体上来说,影响专业课总体水平的课程按课程重要程度依此是C1、C3、C6、C5;

综上所说,关于ABC三类课程的影响程度分析我们得出如下结论:

(1)A类课程对B类课程有显著促进作用,

(2)B类课程对C类课程有显著促进作用,

(3)A类对B类影响与B对C影响程度相同(因为A与B和B与C的第一典型向量的相关系数均在0。

9以上).

7.问题(3)的模型与求解

根据该问的要求,对学生成绩偏差不大的某些课程,计划予以减少。

这里我们采用能反映每个学生成绩离散程度的指标,即标志变异指标。

标志变异指标有:

全距,标准差和离散系数,常用标准差。

实践表明当成绩呈正态分布时全距约有6个标准差(注:

全距与6个标准差之差的绝对值在12分以内认为符合正态分布),也就是说当满分是100分时,标准差为10—15分,学生成绩的离散程度较为合理。

据此,我们这里对于A1科目计算其平均值、标准差和全距:

(图1)

由上可知,全距不为6个标准差,故对于A1科目学生成绩分布不成正态分布,平均成绩代表性弱,成绩离散比较明显。

这点从分布直方图中也是可以明显看出来的。

同理,通过相同的方法可以得出其他些门课程的标志变异指标(具体见附表5).我们采用下面标准对课程范围进行缩减:

1.对于全距约为6个标准差的课程,即成正态分布,我们认为有必要继续开设.(即把范围缩小为不成正态分布的课程)

2.对于全距不为6个标准差的课程,通过比较平均值来判断该课程的难易程度。

(即把范围缩小为不成正态分布的较易课程)注:

平均成绩在75分以下的认为课程比较难。

3.对于经过1和2判断剩余的课程,我们按其标准差由小到大进行排序。

得出结果如下:

课程

B10

B12

C5

A3

C13

B8

B17

标准差

6。

126897

7。

112528

7。

91228

8.109249

8。

180037

9。

165901

9.837603

平均

84.25806

82.74194

82.04839

80.45161

83。

14516

83.22581

75。

51613

全距

18

30

35

31

35

39

44

课程

A17

A11

B16

A4

B18

A2

C1

标准差

10。

41624

10。

45927

10.50904

10.8582

11.56344

11.63735

12。

4402

平均

81。

83871

82.30645

77.22581

81.96774

76.77049

75.41935

75。

20968

全距

40

49

51

43

40

50

54

根据上面的缩减范围之后的课程表,结合问题2中典型相关分析的结果,对于A类课程中较重要课程A16、A7、A3、A17,B类课程中较重要课程B6、B5、B2、B4,C类课程中较重要课程C1、C3、C6、C5,依此选择保留,不予以停开。

则得出最终符合条件,可以计划减少的课程依此是:

课程

B10

B12

C13

B8

B17

标准差

6。

126897

7。

112528

8.180037

9。

165901

9.837603

平均

84.25806

82.74194

83。

14516

83.22581

75.51613

全距

18

30

35

39

44

A11

B16

A4

B18

A2

标准差

10。

45927

10.50904

10。

8582

11。

56344

11.63735

平均

82。

30645

77。

22581

81.96774

76。

77049

75。

41935

全距

49

51

43

40

50

为使结果明显,我们分类对可以减少的课程按其偏差又小到大排列如下:

A类可减课程:

A11、A4、A2

B类可减课程:

B10、B12、B8、B17、B16、B18

C类可减课程:

C13、

至此,我们便把3个问题整体求解完毕,并对得出的结果进行了综合讨论和深度分析。

四模型的评价

8.模型的优点

(1)对问题所给的数据进行了大量的仔细分析和全面的统计;

(2)从实际经验出发,采用平均成绩作为学生的综合成绩,这样减少了指标,更方便建模;

(3)针对问题2采用了典型相关分析法对ABC三类课程进行分析,不仅分析出了三类课程之间的影响程度,而且分成出了每类课程各门科的影响程度,使结论更具说服力和实际意义。

(4)针对问题3采用标志变异指标对各门科目的正态性进行了比较,并通过标准差的不同,综合2问的结论,给出了调整后开设课程的具体方案.

9.模型的缺点

(1)对于问题3根据学生成绩整体偏差不大的课程即计划减少的要求不一定合乎实际;

(2)在分析各类课程之间的影响程度时,不仅只能用学生成绩来衡量,还应考虑其他兴趣、知识需要等方面的因素;

(3)如果给出具体每门课程的试卷题量,可以更具体的分析出相应科目的增减调整情况,由于数据限制使模型与实际存在差异;

五模型改进与应用

10.模型改进

因我们组成员都不来自统计方面专业的,故对统计软件的应用能力目前有限,对于典型相关分析法的应用可以改用EXCEL调入数据,SPSS快速输出结果的方式,避免了用MATLAB构建数据文本,编写程序的繁琐步骤,同时使对数据的分析更快捷,更方便,更直观.

11.模型应用

该模型很好地解决了学校学生成绩的显著性和相关性以及学校对教学负荷的权衡问题,不仅对学校在评价学生成绩方面有指导意义,而且还在对学校教学质量的检验和教学负荷的权控方面有重要参考价值。

参考文献

[1]孙祥徐流美吴清MATLAB7.0基础教程清华大学出版社,2005。

[2]魏巍MATLAB应用数学工具箱技术手册国防工业出版社,2004。

[3]向东进实用多元统计分析150-153中国地质大学出版社,2005。

[4]薛毅数学建模基础208-213北京工业大学出版社,2004

附录

附录1求解AB类课典型相关性所需的matlab程序

Functionfenxi_ab

clc,clear

loadfenxi_ab.txt%原始的相关系数矩阵保存在纯文本文件xiangguanxishujuzhen.txt中

%r为相关系数矩阵

r=fenxi_ab;

n1=18;n2=18;num=min(n1,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2