学生成绩分析.docx
《学生成绩分析.docx》由会员分享,可在线阅读,更多相关《学生成绩分析.docx(30页珍藏版)》请在冰点文库上搜索。
学生成绩分析
学生成绩分析
摘要
学生成绩作为反映学生学习的效率的一项重要的指标,对其进行统计与分析具有重要意义。
本文对问题一,利用均值比较的t检验法和单因素方差分析法,对每个学期各个学生成绩的均值进行分析。
在均值方差比较的显着性的差异的基础上又作出各个学期的直方图,结合图来分析学习成绩在不同的学期是否显着性不同。
用t检验法对两班成绩的显着性分析并得出结论。
问题二中,我们通过建立求Pearson(皮尔森)相关系数模型,并用spss求解,得出A类、B类、C类课程成绩有显着的相关性。
对于问题三:
在对数据进行分析处理后,利用决策论把为学生减负放在第一位,使得每个学期的课程在7门左右,在贪心算法的基础把要减少的课程在偏差最小的15课和难度最大的15门中,得到去掉A4、C8、C13、B18,A9移到第三学期,C9移动第七学期方案。
关键字:
均值比较独立样本t检验单因素方差分析Pearson(皮尔森)系数方差Levene检验
一、问题重述
某大学的某专业的课程分为三类:
公共基础课,专业基础课和专业课(分别用A类、B类、C类表示),附表给出了两个班62名学生7个学期51门课的成绩,根据以下要求对数据进行分析并得出结论:
问题一:
分析该专业的学生的学习成绩在不同的学期是否显着性不同两个班学生的学习成绩是否有显着性不同
问题二:
分析A类、B类、C类课程是否显着性相关,若是,则分析A类课程成绩对B类课程成绩,B类课程成绩对C类课程成绩的影响程度。
问题三:
为了给学生“减负”,学校决定减少不同学生成绩整体偏差不大的课程,请给出调整后开设的课程名称(用附表中的代码表示)。
二、模型假设
1、所有的课程都同样重要,即课程的权重一样。
2、所有的课程在相邻的学期是可调的。
3、每个学期学生成绩的平均值服从正态分布。
三、符号约定
1、Ai、Bi、Cj表示课程标号(i=1..18,j=1..15);
2、Vi表示第i学期的学生成绩的平均数组(i=1..7);
3、班级1、班级2表示1班学生和2班学生;
四、问题分析
问题一:
专业的学生的学习成绩是否显着性不同时,我们用每个学期的成绩平均值来代替每个学期的各门成绩,然后建立起单因素方差分析”模型,两个班级的成绩是否显着性不同,让我们很容易想到建立配对t检验模型来进行求解。
问题二:
为了验证A类、B类、C类课程成绩是否显着性相关。
我们引入“单因素相关分析法”,用spss软件求出Pearson(皮尔森)相关系数,即可得出其相关性和任意两变量间的影响程度。
问题三:
由于要减少的课程要满足不同学生成绩偏差不大的要求,故想到用方差来表示偏差的大小。
并对方差进行升序排序,挑选出前十五名课程,然后根据课程分数平均值和方差等因素从这十五门课程中挑出四门删除。
五、模型的建立
问题一:
针对7个学期学习成绩是否显着性差异,建立“单因素方差分析”模型,对p值进行分析:
统计学中的P值越小,越有理由认为对比事物间存在差异。
当P>称“不
显着”;P<=称“显着”,P<=称“非常显着”。
而对两个班的成绩,先假设两个班学生成绩的方差具有齐次性,后用Levene检验对假设验证,验证模型如下:
其中
若F>,则接受齐次性假设,然后对两个班成绩进行t检验,分析p值,建立t检验模型如下:
设总体X服从设正态分布N(
,
),Y服从设正态分布N(
,
),其中
,
未知,他们未必相等。
分别从整体中抽取样本(
、、、,
)和(
、、、,
)。
我们引入一个新的随机变量Z=X-Y对应的一组子样值(
、、、,
),其中
,i=1,……n。
X、Y的差异反映在
上。
若无显着差异,则应有
=0。
因此问题归结为检验假设
:
=0,
X、Y服从正态分布时,变量Z也服从正态分布,其中
。
构造新统计量:
如果假设成立,根据抽样分布定理可知,统计量T服从自由度n-1的t分布,对于给定的
,则由T分布表可查得临界值
,使
如果算的T的值t落入其拒绝域C:
内,则拒绝
。
问题二:
根据统计学原理,建立Pearson(皮尔森)相关系数求解模型,Pearson(皮尔森)系数r为:
相关系数r的取值范围为1≥r≥-1,r的各种取值的意义为:
r=1,序列X和Y是线性正相关;
r=-1,序列X和Y之间是线性负相关;
r=0,序列X和Y之间不相关;
1>r>0,序列X和Y之间正相关,r越大相关度越高;
0>r>-1,序列X和Y之间负相关,r越接近-1负相关度越高。
问题三:
建立方差比较模型,通过贪心算法来选出方差位于前十五的课程,并在为学生减负的前提下力求各学期课程门数相差不大。
七、模型的求解
问题一:
根据问题一的模型,用spss对其进行单因素方差分析,分析结果如下:
I:
\七学期成绩分布表.sav
表一:
描述
分数
均值的95%置信区间
N
均值
标准差
标准误
下限
上限
极小值
极大值
1
62
.72040
2
62
.65799
3
62
.61235
4
62
.62082
5
62
.84472
6
62
.73396
7
62
.46258
总数
434
.26134
表二:
方差齐性检验
分数
Levene统计量
df1
df2
显着性
6
427
.005
表三:
ANOVA
分数
平方和
df
均方
F
显着性
组间
6
.000
组内
427
总数
433
在此之后检验
表四:
多重比较
因变量:
分数
(I)学期
(J)学期
95%置信区间
均值差(I-J)
标准误
显着性
下限
上限
LSD
1
2
*
.95297
.000
3
.95297
.552
4
*
.95297
.005
5
.95297
.750
6
*
.95297
.043
7
*
.95297
.044
2
1
*
.95297
.000
3
*
.95297
.000
4
.95297
.139
5
*
.95297
.000
6
*
.95297
.022
.3222
7
*
.95297
.021
.3305
3
1
.56788
.95297
.552
2
*
.95297
.000
4
*
.95297
.025
5
.26344
.95297
.782
6
.95297
.153
.5093
7
.95297
.156
.5176
4
1
*
.95297
.005
.8399
2
.95297
.139
.4591
3
*
.95297
.025
.2721
5
*
.95297
.012
.5355
6
.78136
.95297
.413
7
.78965
.95297
.408
5
1
.30444
.95297
.750
2
*
.95297
.000
3
.95297
.782
4
*
.95297
.012
6
.95297
.088
.2459
7
.95297
.090
.2541
6
1
*
.95297
.043
.0586
2
*
.95297
.022
3
.95297
.153
4
.95297
.413
5
.95297
.088
7
.00829
.95297
.993
7
1
*
.95297
.044
.0503
2
*
.95297
.021
3
.95297
.156
4
.95297
.408
5
.95297
.090
6
.95297
.993
Dunnettt(双侧)a
1
7
.95297
.186
.5327
2
7
.95297
.097
3
7
.95297
.521
4
7
.78965
.95297
.912
5
7
.95297
.339
.8371
6
7
.00829
.95297
*.均值差的显着性水平为。
a.Dunnettt检验将一个组视为一个控制组,并将其与所有其他组进行比较。
表五:
同类子集
分数
学期
alpha=的子集
N
1
2
3
Student-Newman-Keulsa
1
62
5
62
3
62
7
62
6
62
4
62
2
62
显着性
.052
.097
Duncana
1
62
5
62
3
62
7
62
6
62
4
62
2
62
显着性
.071
.439
.139
将显示同类子集中的组均值。
a.将使用调和均值样本大小=。
表六:
均值图
表三中f=,p=<,可说明7个学期成绩有显着性不同。
表四可以看出:
成绩显着性不同的学期。
对上图进行分析后得出在学期之中,
1和2、4、6、7
2和1、3、5、6、7
3和2、4
4和1、3、5
5和2、4
6和1、2
7和1、2有显着性不同。
为形象地阐述7个学期成绩的显着性不同,下面作出每个学期人数-成绩分布的直方图,
针对第二小问,在对两个班的学生成绩是否有显着性不同分析时,我们先假设这两班学生的成绩服从正态分布且方差具有齐次性,然后对假设进行Levene检
验,其检验结果如下:
上面两个表为单因数方差分析齐次性检验结果:
t值为,两个自由度分别1和60,双尾显着性概率为>,因此接受方差齐次的假设
进行独立样本t检验
从第一个表可以看出班级1和班级2的平均成绩几乎接近;同时第二个表显示的p值=>,即可说明两个班学生7个学期的成绩没有显着性不同。
问题二:
用spss进行双变量相关分析来求Pearson(皮尔森)系数r得出下表:
描述性统计量
均值
标准差
N
a课程
62
b课程
62
c课程
62
相关性
a课程
b课程
c课程
a课程
Pearson相关性
1
.723**
.678**
显着性(双侧)
.000
.000
平方与叉积的和
协方差
N
62
62
62
b课程
Pearson相关性
.723**
1
.783**
显着性(双侧)
.000
.000
平方与叉积的和
协方差
N
62
62
62
c课程
Pearson相关性
.678**
.783**
1
显着性(双侧
)
.000
.000
平方与叉积的和
协方差
N
62
62
62
**.在.01水平(双侧)上显着相关。
对表分析知上表的相关系数r,p值,A,B,C三门课程在α=水平下呈显着的相关性。
我们认为,影响程度即Pearson(皮尔森)系数r,因此可得到A课程对B课程的影响程度为:
;B课程对C课程的影响程度为:
。
问题三:
在问题三中,由于学生的课程较重,由于较难的课程成绩整体偏低,平均数较小,方差较小。
较易的课程成绩整体偏高,平均数较大,但方差较小。
要减少学生成绩整体偏差不大的课程,就是在51门课程中找到方差较小的前15门课程,如下表:
A4
C13
A10
A14
A6
1,
A15
1,
A8
1,
C12
1,
A5
1,
A11
1,
A12
1,
A9
1,
B17
1,
C8
1,
B9
2,
但作为学生的我们知道学习的负担,考虑到为学生减负的方面和学习知识的要求,我们运用决策论的思想把为学生减负放在第一,对每个课程做了均衡的安排,用贪心算法处理了课程,减少的课程在偏差最小的15课和难度最大(即平均值最小)的15门中。
下图为51门课程平均值小的前15门:
A3
A1
B13
B18
B14
B7
A11
A13
A14
A17
B5
B3
C7
B10
C10
第一学期课较多,去掉A4。
第二学期课均衡,且偏差小的课程太多,把A9移到第三学期上。
第四、五学期不变。
第六学期课程较多,C8的不同学生的成绩偏差不大,故把C8去掉,把C9移动第七学期上。
第七学期中课程多,且有难度。
我们去掉偏差小的C13和难度大的B18.调整后的课程方案如下表:
第一学期
第二学期
第三学期
第四学期
第五学期
第六学期
第七学期
课程
A1、B1、A2、B2、A3、B3
、A5
A6、B4、A7、A8、B5、A10
A9、A11、
B6、B7、
A12、B8、A13
A14、A15、
B9、B10、B11、B12
A16、A17、C1、B13、B14、C2、C3
C4、C5、B15、
A18、C6、C7、B16
C9、B17、C10、C10、C11、C12、C14、C15
八、模型评价
本文利用数学统计方法对学生成绩进行一系列的分析,如显着性差异,相关性,均值方差等,对学生成绩评价和统计有很强的现实意义。
本文充分考虑了实际情况,不失一般性,根据数理统计等相关知识,我们建立了单因素方差分析模型,配对t检验模型,Pearson(皮尔森)相关系数求解模型,方差比较模型等对成绩是否显着性不同和是否相关进行了分析,并用spss软件进行模型求解,结论形象生动。
该模型可以帮助学校、企业、政府等单位对一系列相关性的数据分析提供了依据。
不过我们的模型都是在合理假设的条件下建立的,我们所求解的值有近似性,对于那些需要精确计算的问题都不能根据此模型草率计算,而需要根据具体问题具体分析,因此如果能对此模型能做出进一步的深入和改进,使计算变得更加精确合理,将会有更高的使用价值。
九、参考文献
[1]张伯懿.统计学原理[M].北京:
中国石化出版社.,239~244
[2]周复恭.应用数理统计[M].北京:
中国人民大学出版社.,378~391
[3]谢明文.关于协方差、相关系数与相关性的关系[J].数理统计与管理.(3):
33~36
附录:
学生成绩统计表
第一学期成绩
第二学期成绩
第三学期成绩
学生学号
A1
B1
A2
B2
A3
B3
A4
A5
A6
B4
A7
A8
B5
A9
A10
A11
B6
B7
A12
B8
A13
1
71
65
71
71
64
39
76
86
82
60
64
79
67
87
79
72
76
57
86
88
76
2
72
75
84
93
63
68
78
89
80
67
73
75
60
86
79
65
83
72
82
81
72
3
51
78
63
62
50
66
76
96
75
80
92
85
75
96
78
67
95
76
98
84
78
4
79
80
90
54
47
70
76
87
75
65
85
79
61
91
82
74
74
66
85
78
72
5
56
68
89
70
53
26
84
81
77
44
85
77
53
82
82
65
65
48
83
77
67
6
72
85
89
88
75
88
76
84
83
87
90
80
93
89
82
79
90
89
89
86
61
7
69
82
90
93
66
91
76
88
75
92
80
78
93
87
78
71
96
85
75
85
80
8
70
79
65
92
61
82
78
86
78
83
82
89
75
85
86
77
92
57
92
78
66
9
60
83
86
93
66
85
78
82
80
92
87
91
73
89
86
71
82
78
81
91
80
10
74
64
76
92
65
72
78
85
83
67
82
80
53
89
79
77
76
57
90
86
75
11
75
78
81
85
69
69
78
84
76
85
95
84
82
88
82
85
96
80
81
83
72
12
48
68
78
81
65
67
76
95
76
53
60
80
66
88
86
60
66
64
90
65
76
13
52
92
82
87
64
70
78
87
75
79
88
76
70
87
86
74
94
70
82
72
72
14
72
67
85
78
70
66
86
88
81
63
50
85
73
89
83
73
63
69
81
71
83
15
53
63
67
80
65
71
70
78
75
71
78
75
69
85
83
73
83
70
89
78
66
16
75
86
83
64
53
74
78
85
77
77
73
76
67
87
86
80
66
71
81
77
65
17
72
94
90
93
65
88
78
92
80
90
96
80
83
92
86
76
92
75
93
84
77
18
51
63
83
76
50
65
76
84
70
27
66
87
56
84
78
68
75
65
78
84
58
19
72
90
79
93
71
88
84
89
79
97
94
87
87
89
83
78
92
84
87
82
67
20
76
76
81
82
65
72
80
87
73
81
72
84
65
86
74
71
86
67
87
75
66
21
52
47
71
79
50
42
78
88
75
86
67
83
84
88
82
66
74
64
80
88
72
22
54
57
79
64
66
67
78
84
71
64
69
71
53
84
86
66
57
61
79
73
65
23
68
82
82
93
68
90
76
89
80
90
91
88
88
87
78
72
92
69
87
76
68
24
61
60
79
90
66
66
76
82
71
62
69
83
66
89
78
69
70
65
78
68
54
25
72
68
79
79
65
67
84
82
72
87
86
84
74
78
78
70
73
64
82
68
74
26
68
65
80
93
61
73
86
90
78
68
76
88
70
89
87
77
88
79
90
68
69
27
66
79
90
82
62
73
70
83
81
76
77
80
71
88
78
74
85
72
79
63
66
28
77
75
77
84
88
93
76
91
81
88
90
90
85
89
86
76
91
83
88
82
82
29
56
67
68
69
55
90
76
83
74
79
68
86
71
83
78
64
85
68
84
76
59
30
74
91
88
89
74
90
76
84
79
95
95
84
90
87
86
71
97
92
80
90
86
31
56
48
87
83
55
63
78
89
83
83
88
79
70
95
78
75
92
68
85
73
69
32
71
65
70
68
47
66
78
79
86
72
65
82
48
85
83
76
80
68
77
83
80
33
68
82
85
94
73
86
76
89
73
87
9