完整word学生成绩分析模型.docx

资源描述

完整word学生成绩分析模型.docx

《完整word学生成绩分析模型.docx》由会员分享，可在线阅读，更多相关《完整word学生成绩分析模型.docx（25页珍藏版）》请在冰点文库上搜索。

完整word学生成绩分析模型.docx

完整word学生成绩分析模型

学生成绩分析模型

摘要

本文依据数理统计的知识为基础，结合统计分析有关方法，针对大学学生成绩的显著性分析、课程相关性分析和课程增减管理问题,在充分合理的假设条件下，建立了相应的检验和分析模型，并经过多个软件的辅助计算和分析,经过深刻讨论和综合评价，最后给出了学校课程增减的具体方案，很好的解决了相应的问题.

首先，对于问题1用EXCEL求出所给学生每学期的平均成绩，然后根据查资料所得学生成绩总体服从正态分布这一结论，我们做出样本均值假设，构造t统计量，利用数理统计中的假设检验原理,并用SPSS计算出结果为：

该专业学生的成绩在不同学期显著，即不是显著性不同。

接着，对于两个班学生成绩的显著性,对每个学生的七个学期成绩求平均,即将原始数据分为班一和班二两个样本，对于这两个样本我们利用EXCEL中的样本等方差和等均值检验，对两个班的成绩进行检验分析，结果显示：

两个班的学生成绩是显著性不同。

其次，针对问题2，根据题目所求A、B、C类学生成绩的相关关系（即是否显著性相关），我们在问题1的基础之上,通过EXCEL得到了A、B、C三类学生成绩平均成绩，通过SPSS的相关分析，我们初步得到了A、B、C存在显著相关的结论。

接着,我们没有直接选用传统的简单相关性分析法对于A、B、C具体的相关程度分析,而是选择了典型相关性分析法，通过MATLAB的辅助计算,最终我们得出A、B、C三类课程的相关程度，得到了如下结论：

（1）A类课程对B类课程有显著促进作用，

（2）B类课程对C类课程有显著促进作用，

（3）A类对B类影响与B对C影响程度相同

接着,对于问题3,在问题1和2的分析和讨论之下,利用SPSS软件对各学生各科成绩进行了偏差分析，并结合直方图比较，再综合A、B、C类课程的重要程度以及相互影响，我们给出了学校每类课程可减的具体方案:

A类可减课程：

A11、A4、A2;

B类可减课程：

B10、B12、B8、B17、B16、B18；

C类可减课程：

C13；

最后我们对建立的模型优缺点进行了分析，并说明了该模型在实际生活中的推广和应用，为学校对学生成绩的管理和课程设置的管理等有关方面的决策者具有一定的指导意义。

关键词：

显著性检验典型相关分析偏差分析

一问题重述与分析

1.问题重述:

学生成绩分析

在某大学，某专业的大学课程分为三类：

公共基础课（A类）,专业基础课（B类）和专业课（C类）。

现将该专业某年级的大学成绩汇总在附表中。

为了某些需要，仅保留了学生学号,和课程标号（如：

A2表示公共基础课中的第二门课程，B15表示专业基础课中的第15门课程，其他类似）.

就附表中的汇总成绩，试建立相应数学模型解决下面问题：

（1）试分析该专业的学生的学习成绩在不同的学期是否显著性不同.两个班学生的学习成绩是否有显著性不同.（学号1－30为一班学生；31－62为二班学生）我们的理解是：

一般学生的成绩总体服从正态分布，此处判断显著性是不是相同即对样本中的数据进行显著性检验。

（2）学生的A类、B类、C类课程的成绩是否显著性相关。

若是，分析A类课程成绩对B类课程成绩，B类课程成绩对C类课程成绩的影响程度.我们的理解是：

通过某种分析找到A类、B类、C类课程之间的相关方程，并求出相关系数,以分析不同类课程之间的影响程度.

（3）考虑到该专业的教学负荷较重的原因，现计划减少开设的课程门数.由于较难课程的学生成绩整体偏低，较易课程的学生成绩整体偏高，而不同学生的成绩偏差不大，故计划减少学生成绩整体偏差不大的课程（该要求不一定合乎实际）。

试给出调整后开设的课程名称（用附表中的代码表示）.

我们的理解是：

不同课程科目，对应的学生成绩，并不一定服从正态分布,所以导致有几门课程偏离正态分布比较大，即学生成绩整体偏差比较小（相对集中于中间）,对于此类课程可以在下期计划中除去，以减少该专业的教学负荷.

2.问题的分析：

对于问题1，首先用EXCEL对题目中提供的数据进行统计和分析，计算出62个学生每学期的平均成绩,即定为该学生这学期的最终成绩。

这样得到七组学生成绩数据，对应不同学期是否有显著性不同，我们经查阅有关资料得知:

学期学生成绩的总体服从正态分布。

因此，我们对得到的学期成绩样本进行均值假设性检验，利用数理统计中的显著性分析原理,对应总体均值和方差均未知的正态分布构造t统计量，借助SPSS计算出检验的结果即可。

对于两个班学生的成绩，我们在学期平均成绩基础之上，对每位学生的学期总成绩求均值,这样以班为单位将数据分成两组，对应这两个分别来自同一个总体的样本，我们对其进行等方差和等均值分析,借助SPSS同样可得出结果。

对于问题2，利用同1一样的初始数据处理方法，得到每学生A、B、C三类课程每类的平均成绩（不考虑学期与学期之间的影响），研究三类课程之间的相关关系,很容易让我们想到用相关分析法，然而常规的相关分析法只能得到对某类课程某门科目对某类课程某门科目的关系，即点对点的分析。

于是，我们通过查阅资料和方法比较采用了典型相关分析法分析此问，最后根据得到的样本典型变量和相关系数,从而分析出三类课程之间的相互影响关系。

对于问题3，我们没有选择平均成绩进行分析，而是直接对每门课的62各学生成绩进行标志变异指标分析，进而对该门课的成绩是否服从正态分别做出判断。

最后结合问题2的结论,综合给出了有关课程增减的调整方案。

二模型假设和符号说明

3.模型的假设：

（1）题目提供的相关统计数据真实可信；

（2）公共基础课、专业基础课和专业课重要性同等；

（3）学生与学生之间的成绩相互独立,同一学生同一类课程不同学期之间的成绩相互独立;

（4）不同类课程之间存在影响，不同类课程的不同科目之间也存在影响;

（5）学生的某学期平均成绩能够较好的反应学生的综合成绩；

4.符号的说明:

其他符号在模型中运用时再作说明.

三模型的建立与求解

5.问题1的模型建立与求解

假设检验原理：

设学生成绩的总体

其中

已知，矩阵

未知。

从总体中随机抽取的n个样本（X1，X2…Xn）.检验其均值与总体均值的显著性差异步骤如下：

1）作统计假设

2）引入统计量

（T服从自由度为n-1的t分布）

3）对于选取的显著水平α，查T分布表，求出能使

满足的临界值

4）由样本中的学生成绩技术出引入的统计量T值,并和临界值

比较，如果

〉

则拒绝假设

；反之,则接受假设

。

通过查阅资料,我们得知：

学生的成绩总体服从正态分布，我们对附表中的数据,现用EXECL对每位学生的学期成绩求平均，并以此代表该学生当前学期的综合学习成绩,求得每学期的62名学生的总平均成绩为：

75.94

80。

06468

76。

50452

78.65081

76。

24242

77。

82435

77.86371

依据上面讲述的均值假设检验原理,结合上面的样本均值，利用SPSS求得结果如下:

表1显著性检验

单个样本均值检验

检验值=0

差分的95%置信区间

Sig。

（双侧）

均值差值

下限

上限

第一学期

105.411

。

000

75。

93750

74。

4970

77。

3780

第二学期

121。

681

。

000

80.06452

78。

7488

81。

3802

第三学期

124。

937

。

000

76。

50538

75。

2809

77.7299

第四学期

126.688

。

000

78。

65054

77。

4091

79。

8919

第五学期

90.257

。

000

76。

24194

74.5528

77。

9311

第六学期

104.308

.000

77.82437

76。

3324

79.3163

第七学期

168.318

。

000

77。

86089

76.9359

78.7859

由上表得，Sig即为双侧检验的P值，在a=0.05的显著性水平下各学期的检验P值均为0，故可以得出结论：

该专业学生的学习成绩在不同学期不是显著性不同。

同样依于EXCEL的数据处理，求出每个学生七个学期的总平均成绩（即每个学期的综合学习成绩加和取平均）。

并根据该专业两个班的人数将其分成1-30为一组，31—62为一组，我们把每个班看作一个来自学生成绩总体的样本，这样两个班的学期总平均成绩即为来自同一总体的两个总体。

利用EXCEL进行等方差和等均值检验,结果如下:

表2等方差检验和等均值检验

F-检验

t—检验

1班

2班

1班

2班

平均

77.08138

78。

10387

平均

77.08138

78。

10387

方差

22.12164

15。

82306

方差

22.12164

15。

82306

观测值

1。

398063

tStat

—0.91128

P（F〈=f）单尾

0。

184617E—5

P（T<=t）单尾

0。

182961E-5

F单尾临界

1.854399

t单尾临界

1.671553

由表可知，等方差检验的F=1。

398063〈1。

854399（临界）,等均值检验的t=—0.91128<1。

671553（临界），即等方差和等均值检验都通过了检验，这表明：

两个班的学生学习成绩存在显著差异，即显著性不同。

6.问题2的模型建立与求解

根据假设5，继续同样通过EXCEL计算出A、B、C三类的平均成绩,通过SPSS的简单相关分析,结果如下:

表3三类课程平均成绩相关性