1、数据挖掘在学生成绩数据管理中的应用研究的数学建模数据挖掘在学生成绩数据管理中的应用研究的数学建模摘要:本文解决的是成绩评估问题,在未知所有考生的成绩信息的前提下,通过其余考生的成绩从而首先对整体数据进行补全。并通过不同场次的考试成绩,从而对个人的考试成绩、整体班集体状况进行一个整体的评估。最后班与班之间,在(1)和(2)的基础之上,再进行更进一步的分析,对班集体的整体成绩水平以及波动性进行更全面的了解和分析。关键字:均值、方差、成绩1.问题重述1.1问题背景 近年来,随着大数据成为互联网信息技术行业的流行词汇,教育逐渐被认为是大数据可以大有作为的一个重要应用领域,有人大胆地预测大数据将给教育带
2、来革命性的变化。在教育特别是在学校教育中,数据成为教学改进最为显著的指标。通常,这些数据主要是指考试成绩。现在,大数据分析已经被成功应用到教育中,成为教学改革的重要力量。通过分析大数据,我们就能发现一些重要信息,并利用它们为改善学生的成绩提供个性化的服务。我们收集了一些学生的考试成绩数据,请根据这些数据分析下面的问题。1.2 需要解决的问题 1)请问如何定量描述某位同学在最近几次考试中进步退步情况?请建立相应的模型进行说明,并根据所建模型求出1班的每位同学在最近几次考试中进步或退步多少。 2)请问如何定量描述某班在最近几次考试中的进步退步情况?请建立相应的模型进行说明,并根据所建模型求出每个班
3、在最近几次考试中进步或退步多少。3)请问如何通过最近七次考试定量描述一个班的整体学习成绩情况?请建立相应的模型进行说明,并根据所建模型对6个班进行排序。2.模型假设假设1:考生成绩真实有效,不存在作弊行为。假设2:考生成绩发挥稳定,能代表平时水平。假设3:改卷老师为同一群体老师改卷,能够确保尽量公平。假设4:考生每次考试之间间隔时间足够长,考生成绩具有一定的代表性。 3.符号说明符号符号说明average1取1班1考生其余成绩的平均值average2取1班2考生其余成绩的平均值average3取1班3考生其余成绩的平均值average4取1班4考生其余成绩的平均值Average17取1班17考
4、生其余成绩的平均值Average18取1班18考生其余成绩的平均值Average19取1班19考生其余成绩的平均值Average22取1班22考生其余成绩的平均值Average23取1班23考生其余成绩的平均值Average28取1班28考生其余成绩的平均值Average35取1班35考生其余成绩的平均值 av1 1班1考生中前3次成绩的平均值 av11班1考生中后四次成绩的平均值 . av401班40考生中前3次成绩的平均值av401班40考生中前3次成绩的平均值rate后四次成绩相比前3次成绩的增长率A11班第一次考试的平均成绩A21班第二次考试的平均成绩A31班第三次考试的平均成绩A41
5、班第四次考试的平均成绩A51班第五次考试的平均成绩A61班第六次考试的平均成绩A71班第七次考试的平均成绩4.问题分析与解答针对问题1:由于1班考生有3个考生在一次考生中出现缺考情况,因此采用其余6次考试成绩的均值代替该次缺考成绩。而7次考试成绩拟采用分为2阶段成绩,前三次成绩取均值记作后四次成绩记作,并计算对应的增减幅度百分比。有如下: 1班的缺考考生通过求取均值可为:60.5、70.5、80.5、90.5、92、95、100、100、101、116。此时,数据已经全部恢复。如下表所示即可恢复后的1班考生数据,接下来通过分别求取前三次成绩以及后四次成绩的均值即可算出评价指标也就是目标函数ra
6、te。序号第一次考试成绩第二次考试成绩第三次考试成绩第四次考试成绩第五次考试成绩第六次考试成绩第七次考试成绩160.5546760705062270.5647770806072380.5748780907082490.58497901008092553494349624459670736972787973771757661736362874737083666864975677065678578107578686880757411777071717668801282928486828185138292878176838414868008788937715879681908496781691100
7、829599869817919182921009890189395969910396831994881008593102872095859810085968721968986105869990229710710792951031002398100998910110610524981041011021079093259810010889105891082698100101981039790279994941089089962899991011061071019529106112102113102106108301061059910397104102311091171051151161111133
8、211010111711311011211633112114102118122116114341121101161111071121193511212011311611811911536113117120117114120112371131041051201061201193811312011411810711810639114108120114120104116如下为求取前三次平均值在matlab中的运算结果:a = 60.5000 54.0000 67.0000 70.5000 64.0000 77.0000 80.5000 74.0000 87.0000 90.5000 84.0000
9、97.0000 53.0000 49.0000 43.0000 70.0000 73.0000 69.0000 71.0000 75.0000 76.0000 74.0000 73.0000 70.0000 75.0000 67.0000 70.0000 75.0000 78.0000 68.0000 77.0000 70.0000 71.0000 82.0000 92.0000 84.0000 82.0000 92.0000 87.0000 86.0000 80.0000 0 87.0000 96.0000 81.0000 91.0000 100.0000 82.0000 91.0000 9
10、1.0000 82.0000 93.0000 95.0000 96.0000 94.0000 88.0000 100.0000 95.0000 85.0000 98.0000 96.0000 89.0000 86.0000 97.0000 107.0000 107.0000 98.0000 100.0000 99.0000 98.0000 104.0000 101.0000 98.0000 100.0000 108.0000 98.0000 100.0000 101.0000 99.0000 94.0000 94.0000 99.0000 99.0000 101.0000 106.0000 1
11、12.0000 102.0000 106.0000 105.0000 99.0000 109.0000 117.0000 105.0000 110.0000 101.0000 117.0000 112.0000 114.0000 102.0000 112.0000 110.0000 116.0000 112.0000 120.0000 113.0000 113.0000 117.0000 120.0000 113.0000 104.0000 105.0000 113.0000 120.0000 114.0000 114.0000 108.0000 120.0000 mean(a,2)ans =
12、 60.5000 70.5000 80.5000 90.5000 48.3333 70.6667 74.0000 72.3333 70.6667 73.6667 72.6667 86.0000 87.0000 55.3333 88.0000 91.0000 88.0000 94.6667 94.0000 92.6667 90.3333 103.6667 99.0000 101.0000 102.0000 99.6667 95.6667 99.6667 106.6667 103.3333 110.3333 109.3333 109.3333 112.6667 115.0000 116.6667
13、107.3333 115.6667 114.0000 同理将后四次的平均值求取为: b = 60 70 50 62 70 80 60 72 80 90 70 82 90 100 80 92 49 62 44 59 72 78 79 73 61 73 63 62 83 66 68 64 65 67 85 78 68 80 75 74 71 76 68 80 86 82 81 85 81 76 83 84 87 88 93 77 90 84 96 78 95 99 86 98 92 100 98 90 99 103 96 83 85 93 102 87 100 85 96 87 105 86 99
14、 90 92 95 103 100 89 101 106 105 102 107 90 93 89 105 89 108 98 103 97 90 108 90 89 96 106 107 101 95 113 102 106 108 103 97 104 102 115 116 111 113 113 110 112 116 118 122 116 114 111 107 112 119 116 118 119 115 117 114 120 112 120 106 120 119 118 107 118 106 114 120 104 116 mean(b,2)ans = 60.5000
15、70.5000 80.5000 90.5000 53.5000 75.5000 64.7500 70.2500 73.7500 74.2500 73.7500 83.5000 81.0000 86.2500 87.0000 94.5000 95.0000 95.2500 91.7500 92.0000 95.0000 97.5000 100.2500 98.0000 97.7500 97.0000 95.7500 102.2500 107.2500 101.5000 113.7500 112.7500 117.5000 112.2500 117.0000 115.7500 116.2500 1
16、12.2500 113.5000 通过以上2次运算得到2次大的考生成绩对比: c = 60.5000 60.5000 70.5000 70.5000 80.5000 80.5000 90.5000 90.5000 48.3333 53.5000 70.6667 75.5000 74.0000 64.7500 72.3333 70.2500 70.6667 73.7500 73.6667 74.2500 72.6667 73.7500 86.0000 83.5000 87.0000 81.0000 55.3333 86.2500 88.0000 87.0000 91.0000 94.5000 8
17、8.0000 95.0000 94.6667 95.2500 94.0000 91.7500 92.6667 92.0000 90.3333 95.0000 103.6667 97.5000 99.0000 100.2500 101.0000 98.0000 102.0000 97.7500 99.6667 97.0000 95.6667 95.7500 99.6667 102.2500 106.6667 107.2500 103.3333 101.5000 110.3333 113.7500 109.3333 112.7500 109.3333 117.5000 112.6667 112.2
18、500 115.0000 117.0000 116.6667 115.7500 107.3333 116.2500 115.6667 112.2500 114.0000 113.5000 c(:,2)-c(:,1)ans = 0 0 0 0 5.1667 4.8333 -9.2500 -2.0833 3.0833 0.5833 1.0833 -2.5000 -6.0000 30.9167 -1.0000 3.5000 7.0000 0.5833 -2.2500 -0.6667 4.6667 -6.1667 1.2500 -3.0000 -4.2500 -2.6667 0.0833 2.5833
19、 0.5833 -1.8333 3.4167 3.4167 8.1667 -0.4167 2.0000 -0.9167 8.9167 -3.4167 -0.5000 d=60.5 070.5 080.5 090.5 048.3333 5.166770.6667 4.833374 -9.2572.3333 -2.083370.6667 3.083373.6667 0.583372.6667 1.083386 -2.587 -655.3333 30.916788 -191 3.588 794.6667 0.583394 -2.2592.6667 -0.666790.3333 4.6667103.6
20、667 -6.166799 1.25101 -3102 -4.2599.6667 -2.666795.6667 0.083399.6667 2.5833106.6667 0.5833103.3333 -1.8333110.3333 3.4167109.3333 3.4167109.3333 8.1667112.6667 -0.4167115 2116.6667 -0.9167107.3333 8.9167115.6667 -3.4167114 -0.5d = 60.5000 0 70.5000 0 80.5000 0 90.5000 0 48.3333 5.1667 70.6667 4.833
21、3 74.0000 -9.2500 72.3333 -2.0833 70.6667 3.0833 73.6667 0.5833 72.6667 1.0833 86.0000 -2.5000 87.0000 -6.0000 55.3333 30.9167 88.0000 -1.0000 91.0000 3.5000 88.0000 7.0000 94.6667 0.5833 94.0000 -2.2500 92.6667 -0.6667 90.3333 4.6667 103.6667 -6.1667 99.0000 1.2500 101.0000 -3.0000 102.0000 -4.2500
22、 99.6667 -2.6667 95.6667 0.0833 99.6667 2.5833 106.6667 0.5833 103.3333 -1.8333 110.3333 3.4167 109.3333 3.4167 109.3333 8.1667 112.6667 -0.4167 115.0000 2.0000 116.6667 -0.9167 107.3333 8.9167 115.6667 -3.4167 114.0000 -0.5000 d(:,2)/(d(:,1)0000 0.0443 0.0414 -0.0793 -0.0179 0.0264 0.0050 0.0093 -0
23、.0214 -0.0514 0.2650 -0.0086 0.0300 0.0600 0.0050 -0.0193 -0.0057 0.0400 -0.0529 0.0107 -0.0257 -0.0364 -0.0229 0.0007 0.0221 0.0050 -0.0157 0.0293 0.0293 0.0700 -0.0036 0.0171 -0.0079 0.0764 -0.0293 -0.0043 如上所示即为1班所有考生的进步率,正值代表进步,而负值代表退步。数值越大表示进步或者退步的幅度越大。针对问题2分析: 题目要求我们定量描述某班在最近几次考试中的进步退步情况,那么我们可
24、以依旧取1班的成绩情况为例进行数据分析。可以取得1班每次考试成绩的值分别为:A1=92.33、A2=92.33、A3=90.13、A4=93.10、A5=93.97、A6=92.03、A7=91.90。若仍然采用1中所述方法,则为,本模型较为简易,通过每次考试的均值来对整体考试波动情况进行评估。经计算为0.013。为1班考生在7次考试中的整体增幅。整体分析而言成绩是有进步。针对问题3分析:本题需要对最近七次考试定量描述一个班的整体学习成绩情况,那么可以求取每个班集体的均值和方差,并相互之间做一个比较,从而得出每个班集体的成绩的总体情况:先以一班为例计算,(2)中已经对其均值做了分析。当然(2)
25、是在(1)的基础上进行完善的,那么此时可以把1班的方差也求取:将1班数据导入matlab计算得出方差为1.0948。同理也分别求取2,3,4,5,6班的均值和方差。同理1班,其余5班依次通过(1)和(2)的过程,可分别得到2班同学成绩均值和方差分别为:87.82、1.315,3班同学成绩均值和方差为:88.54、2.8788,而4班同学成绩均值和方差分别为:87.89、1.3336,而5班同学成绩均值和方差为:86.95、1.5977,而6班同学成绩的均值和方差分别为:92.79、1.3735。以上将各个班集体7次考试成绩的平均值以及方差波动数据均以获得。从均值角度来看,6班好于1班好于3班好于4班好于2班好于5班。若从方差稳定性来看:则1班好于2班好于4班好于6班好于5班好于3班。综合来说,(3)中的数据获取以及分析源自于(1)、(2),暂时还没有想到一个综合参数可以将均值和方差进行加权值。从而综合对各个班的成绩情况进行判定。
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2