大学生数学建模竞赛之大数据分析报告.docx

上传人:b****1 文档编号:13546590 上传时间:2023-06-15 格式:DOCX 页数:22 大小:391.42KB
下载 相关 举报
大学生数学建模竞赛之大数据分析报告.docx_第1页
第1页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第2页
第2页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第3页
第3页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第4页
第4页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第5页
第5页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第6页
第6页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第7页
第7页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第8页
第8页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第9页
第9页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第10页
第10页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第11页
第11页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第12页
第12页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第13页
第13页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第14页
第14页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第15页
第15页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第16页
第16页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第17页
第17页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第18页
第18页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第19页
第19页 / 共22页
大学生数学建模竞赛之大数据分析报告.docx_第20页
第20页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

大学生数学建模竞赛之大数据分析报告.docx

《大学生数学建模竞赛之大数据分析报告.docx》由会员分享,可在线阅读,更多相关《大学生数学建模竞赛之大数据分析报告.docx(22页珍藏版)》请在冰点文库上搜索。

大学生数学建模竞赛之大数据分析报告.docx

大学生数学建模竞赛之大数据分析报告

某某学院第五届大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规如此.

我们完全明白,在竞赛开始后参赛队员不能以任何方式〔包括、电子、网上咨询等〕与队外的任何人〔包括指导教师〕研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规如此的,如果引用别人的成果或其他公开的资料〔包括网上查到的资料〕,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们X重承诺,严格遵守竞赛规如此,以保证竞赛的公正、公平性。

如有违反竞赛规如此的行为,我们将受到严肃处理。

所属院系〔请填写完整的全名〕:

能源工程学院

我们参赛选择的题号是〔C〕

参赛队员:

队员名

系别

学号

联系

是否队长

李泽辉

2011级电气

1105230116

X新江

2011级电气

1105230145

温新鹏

2011级电气

1105230146

 

日期:

2013年5月18日

一、问题重述

C题:

面试考核打分问题

某市统计局在公开招考面试环节中,组成一个六人专家小组,对51名应试者进展了面试考核,各位专家对每位面试者进展了打分〔见附表〕,请你运用数学建模方法解决如下问题:

〔1〕补齐表中缺失的数据,给出补缺的方法与理由,并给出录取顺序。

〔2〕六位专家中哪位专家打分比拟严格,哪位专家打分比拟宽松,并对六位专家的打分质量进展排序。

〔3〕作为人事部门主管,你认为哪些面试者应给予第二次面试的机会。

在今后的面试工作中,如何合理安排面试工作。

数据附表

序号

专家1

专家2

专家3

专家4

专家5

专家6

1

70

63

81

88

76

78

2

87

67

64

66

72

72

3

83

76

68

66

73

71

4

72

68

83

93

83

94

5

83

72

90

79

81

88

6

74

61

72

52

65

63

7

76

78

66

68

72

73

8

55

91

62

81

75

78

9

65

94

72

77

79

75

10

81

90

68

74

78

73

11

76

59

91

81

74

63

12

52

83

77

68

75

84

13

89

81

73

79

82

83

14

81

70

76

59

76

91

15

87

55

87

63

77

89

16

63

66

88

53

72

85

17

88

68

71

80

76

75

18

90

80

53

93

79

80

19

62

70

85

94

72

51

20

51

70

66

69

64

61

21

77

81

73

74

78

78

22

71

88

58

57

68

65

23

82

80

82

66

75

57

24

71

61

51

76

71

90

25

52

62

78

88

72

80

26

53

82

70

68

72

80

27

72

71

94

63

76

73

28

58

73

63

84

73

85

29

58

80

87

58

73

77

30

76

73

87

68

72

50

31

85

87

63

53

76

86

32

60

82

74

76

76

78

33

58

92

75

64

74

75

34

55

87

85

58

77

93

35

73

74

78

62

75

87

36

61

94

65

88

80

81

37

82

96

73

77

83

88

38

83

71

80

91

78

68

39

83

89

64

71

78

73

40

86

69

82

70

73

53

41

73

85

82

63

77

89

42

61

79

70

60

67

72

43

87

93

82

73

83

69

44

86

70

66

88

75

67

45

88

81

94

69

84

87

46

53

90

78

88

76

65

47

80

88

79

73

78

71

48

88

73

78

81

77

64

49

*

85

78

78

73

56

50

73

*

64

86

77

78

51

68

85

*

83

76

69

注:

*表示专家有事外出未给应聘者打分

二、问题分析

这个问题属于数类统计学随机性模型,可采用画图形、逻辑运算、数值运算等各种数学方法和计算机技术。

三、模型假设

专家意外情况导致的数据缺失是一种完全随机缺失。

专家打分公平公正公开,不受任何人际关系影响并且在整个过程中保持一致

用人单位对每一位专家打分的重视程度一样。

四、符号说明

〔i为1、2、3〕表示专家所打分数的的平均数;

给每位面试者的得分;

〔i为1、2、3、4、5、6〕表示各位专家所打分数的方差;

=

=

称为置信限;

四、模型建立

统计学的思想是对随机事件的现象进展统计分析,将随机性归纳于可能的规律性中。

而且也可以从差异中发现趋势。

因为该题有着统计学的本质特征:

数据的随机性,在该题我们将应用到统计中的统计数据分析和统计推断。

将经收集好数据进展分析,得出与推断内中的趋势。

均值插补

根据辅助信息数据将样本分为假如干组,使组内各单位的主要特征相似。

然后分别介绍各组目标变量的均值,将各组均值作为组内所有缺失数据项的替补值。

K-S检验法原理:

K-S检验是统计学中在对一组数据进展统计分析是所用到的一种方法。

它是将需要做统计分析的数据和另一组标准数据进展比照,求得它和标准数据之间的偏差的方法。

一般在K-S检验中,先计算需要做比拟的两组观察数据的累积分布函数,然后求这两个累积分布函数的差的绝对值中的最大值D。

最后通过查表以确定D值是否落在所要求对应的置信区间内。

假如D值落在了对应的置信区间内,说明被检测的数据满足要求。

反之亦然。

为了更直观的说明专家所给分值服从正态分布,本文运用MATLAB软件绘出了专家1、专家2、专家3相对应所给分值的直方频率图、Q-Q图〔见四、模型求解〕。

区间估计模型:

区间估计指对总体中的一维参数

,构造两个统计量:

=

=

,满足对于预先给定的很小的概率

,有

,这时,称区间

的置

信区间,称

为置信限,概率称为显著水平〔或置信度〕,

称为置信水平〔或置信概率〕。

方差:

方差是各个数据与平均数之差的平方的平均数。

在概率论和数理统计中,方差〔英文Variance〕用来度量随机变量和其数学期望〔即均值〕之间的偏离程度。

在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。

Q-Q图:

Q-Q图是一种散点图,对应于正态分布的Q-Q图,就[1]是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.用QQ图还可获得样本偏度和峰度的粗略信息.

Q-Q图可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进展检验的。

P-P图和Q-Q图的用途完全一样,只是检验方法存在差异。

由于P-P图和Q-Q图的用途完全一样,只是检验方法存在差异。

要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.

用QQ图还可获得样本偏度和峰度的粗略信息.

五、模型求解

〔1〕补齐表中缺失的数据,给出补缺的方法与理由,并给出录取顺序。

1 补齐表中缺失的数据,给出补缺的方法与理由。

〔补齐后数据见附表〕

 

由SPSS软件求解:

局部数据,其中专家1第49号数据未得出用00表示,其他专家同理。

依次对专家1、2、3、4、5、6的其他数据进展分析,得出如下结果,如如下图所示:

 

专家1的频率分布直方图专家1的标准Q-Q图

专家2的频率分布直方图专家2的标准Q-Q图

专家3的频率分布直方图专家3的标准Q-Q图

专家4的频率分布直方图专家4的标准Q-Q图

专家5的频率分布直方图专家5的标准Q-Q图

专家6的频率分布直方图专家6的标准Q-Q图

如图表可知:

专家1的置信区间在[],均值7,修正后的均为均在置信区间内,所以可估计专家甲的缺失值为73。

同理得出专家2的置信区间在[7],均值7,修正后的均值均在置信区间内,所以估计专家乙的缺失值为78。

专家3的置信区间在[]均值修正后的均值均在置信区间内,所以估计专家丙的缺失值为75。

〔说明:

5%修整均值就是把排在最前面和最后面5%的数据都删掉,之后再计算的均值,这样就使得均值不容易受均值影响,更能代表〕

 

2 给出录取顺序

表一

 

序号

平均分

总分

45

83.8

503

37

83.2

499

4

82.2

493

5

82.2

493

13

81.2

487

43

81.2

487

18

79.2

475

38

78.5

471

36

78.2

469

41

78.2

469

47

78.2

469

10

77.3

464

9

77.0

462

21

76.8

461

48

76.8

461

15

76.3

458

17

76.3

458

39

76.3

458

51

76.0

456

1

76.0

456

50

76.0

456

34

75.8

455

14

75.5

453

44

75.3

452

31

75.0

450

46

75.0

450

27

74.8

449

35

74.8

449

32

74.3

446

11

74.0

444

49

73.8

443

8

73.7

442

23

73.7

442

12

73.2

439

33

73.0

438

3

72.8

437

28

72.7

436

19

72.3

434

7

72.2

433

29

72.2

433

40

72.2

433

25

72.0

432

2

71.3

428

16

71.2

427

30

71.0

426

26

70.8

425

24

70.0

420

42

68.2

409

22

67.8

407

6

64.5

387

20

63.5

381

 

(2)六位专家中哪位专家打分比拟严格,哪位专家打分比拟宽松,并对六位专家打分质量进展排序。

再根据SPSS软件中的方差可推断出,对于所有的应聘者,专家打分的均值可以作为衡量专家打分的一个重要标准,在均值一样时,专家打分方差越大说明打分越严格。

据图表中数据,我们可得出专家中依严格到不严格的顺序为:

专家1→专家4→专家6→专家2→专家3→专家5

(3)作为人事部门主管,你认为那些面试者应给予第二次面试机会。

在今后的面试工作中,如何合理安排面试工作。

因为专家评分标准不同,我们对面试者进展重新排名,先去掉6名专家中的最大值和最小值再求和,求平均数,表如下:

表二

序号

专家1

专家2

专家3

专家4

专家5

专家6

总分

平均数

45

88

81

84

87

340

85

4

72

83

93

83

331

5

83

79

81

88

331

37

82

77

83

88

330

18

90

80

79

80

329

13

81

79

82

83

325

43

87

82

73

83

325

41

73

85

82

77

317

15

87

87

63

77

314

36

65

88

80

81

314

38

83

71

80

78

312

78

31

85

63

76

86

310

47

80

79

73

78

310

48

73

78

81

77

309

21

77

74

78

78

307

34

87

85

58

77

307

46

78

88

76

65

307

10

81

74

78

73

306

50

73

78

77

78

306

1

70

81

76

78

305

39

83

71

78

73

305

32

74

76

76

78

304

76

9

72

77

79

75

303

12

83

77

68

75

303

14

81

70

76

76

303

23

80

82

66

75

303

51

75

83

76

69

303

17

71

80

76

75

302

49

73

78

78

73

302

35

73

74

78

75

300

75

44

86

70

75

67

298

8

62

81

75

78

296

74

11

76

81

74

63

294

40

69

82

70

73

294

28

73

63

84

73

293

25

62

78

72

80

292

73

27

72

71

76

73

292

73

26

70

68

72

80

290

7

76

68

72

73

289

19

62

70

85

72

289

30

76

73

68

72

289

3

76

68

73

71

288

72

29

80

58

73

77

288

72

33

75

64

74

75

288

72

16

63

66

72

85

286

24

71

61

76

71

279

2

67

66

72

72

277

42

61

70

67

72

270

22

71

58

68

65

262

6

61

72

65

63

261

20

66

69

64

61

260

65

1 将表二和表一进展比拟,假如以前二十名为录取资格,如此表二前二十名中且没在表一前二十名中出现的应聘者应给与第二次机会。

如此第37名,31名,34名,46名,50名应给与第二次机会。

2 在今后的面试工作中,应该这样安排面试工作:

如果第二次面试的专家小组只由其中的4位专家组成。

假如此项工作必须要求应聘者有较强的工作能力,如此应请专家1,专家4,专家6和专家2组成专家组。

假如要求很宽松,专家6、专家2、专家3、专家5组成。

假如要求较宽松,如此没有专家1和专家5,即专家4、专家6、专家2、专家3。

六、模型评价

此模型可有效提高面试效率,减少人才损失,灵活的挑选应聘者。

但均值插补会产生偏估计。

总分排序对某些应聘者有一定的不公平性。

七、参考献文

[2]SPSS13.0统计软件教程X晓〔东南大学〕c:

\iknow\docshare\data\cur_work\wenku.baidu\view\fbff0cebf8c75fbfc77db2ec.html

[4]缺失数据的处理方法〔均值插补法〕访问网址c:

\iknow\docshare\data\cur_work\wenku.baidu\view\51c30f0316fc700abb68fcfe.html

[5]数学建模与典型案例分析李志林,欧宜贵丛书名出版社:

化学工业2007-04-01

八、附录

补全后的数据表格

序号

专家1

专家2

专家3

专家4

专家5

专家6

1

70

63

81

88

76

78

2

87

67

64

66

72

72

3

83

76

68

66

73

71

4

72

68

83

93

83

94

5

83

72

90

79

81

88

6

74

61

72

52

65

63

7

76

78

66

68

72

73

8

55

91

62

81

75

78

9

65

94

72

77

79

75

10

81

90

68

74

78

73

11

76

59

91

81

74

63

12

52

83

77

68

75

84

13

89

81

73

79

82

83

14

81

70

76

59

76

91

15

87

55

87

63

77

89

16

63

66

88

53

72

85

17

88

68

71

80

76

75

18

90

80

53

93

79

80

19

62

70

85

94

72

51

20

51

70

66

69

64

61

21

77

81

73

74

78

78

22

71

88

58

57

68

65

23

82

80

82

66

75

57

24

71

61

51

76

71

90

25

52

62

78

88

72

80

26

53

82

70

68

72

80

27

72

71

94

63

76

73

28

58

73

63

84

73

85

29

58

80

87

58

73

77

30

76

73

87

68

72

50

31

85

87

63

53

76

86

32

60

82

74

76

76

78

33

58

92

75

64

74

75

34

55

87

85

58

77

93

35

73

74

78

62

75

87

36

61

94

65

88

80

81

37

82

96

73

77

83

88

38

83

71

80

91

78

68

39

83

89

64

71

78

73

40

86

69

82

70

73

53

41

73

85

82

63

77

89

42

61

79

70

60

67

72

43

87

93

82

73

83

69

44

86

70

66

88

75

67

45

88

81

94

69

84

87

46

53

90

78

88

76

65

47

80

88

79

73

78

71

48

88

73

78

81

77

64

49

73

85

78

78

73

56

50

73

78

64

86

77

78

51

68

85

75

83

76

69

 

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 临时分类 > 批量上传

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2