高教社杯全国大学生数学建模竞赛论文.docx

资源描述

高教社杯全国大学生数学建模竞赛论文.docx

《高教社杯全国大学生数学建模竞赛论文.docx》由会员分享，可在线阅读，更多相关《高教社杯全国大学生数学建模竞赛论文.docx（15页珍藏版）》请在冰点文库上搜索。

高教社杯全国大学生数学建模竞赛论文.docx

高教社杯全国大学生数学建模竞赛论文

2012高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

贵州师范大学

参赛队员（打印并签名）：

1.孟天碧

2.吴小军

3.丁旭界

指导教师或指导教师组负责人（打印并签名）：

王敏

日期：

年月日

赛区评阅编号（由赛区组委会评阅前进行编号）：

2012高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时使用）：

评

阅

人

评

分

备

注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

A题：

葡萄酒的评价

摘要

葡萄酒质量的优劣是生产商与消费者共同关注的话题，而能够准确地检验出葡萄酒质量好坏的方法与指标更是相关人士关注的热点。

但不同种类的葡萄酒有各自的特点，对此我们进行了深入的探讨：

针对问题1：

在分析了附表1的数据之后，我们用EXCEL软件处理每种酒的得分平均数，从两组平均数的差别大得出两组评酒员的评论结果有显著性差异，然后应用MATLAB软件计算出每组评酒员对不同酒样品评价分数的方差，分别绘出第一组评酒员与第一组评酒员对每种葡萄酒样品评分方差的变化曲线，在对方差曲线进行分析，得出第二组评分更可信的结论。

针对问题2：

对氨基酸、蛋白质、总酚、单宁等运用SPSS软件进行主成分分析，得出解释的总方差和成分矩阵，提取主成分，

针对问题3：

关键词：

MatlabExcelSpss方差主成分分析

一问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题：

1.分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量？

二问题假设

（1）假设所有数据均是准确的。

（2）所有评酒员都是认真，公平地对待且独立评分的，并且是随机分布到第一组与第二组的。

（3）所有评酒员有较好的感官与足够的感官阈值，对样品有高水平的鉴赏能力。

（4）所有评酒员都有丰富的经验。

（5）所有评酒员都在相同的环境中进行鉴别的。

三符号含义

：

方差的平方

Xi：

酒的总分数

ai:

协方差矩阵的特征向量

X：

协方差矩阵

Fi：

综合指标

i：

特征值

四模型的建立与求解

4.1对于第一问。

首先无论对于什么样的问题，如果大家独立的意见越一致，那么这种意见就越可信，那么评价的可信度就越高，所以对于问题1的解题思路也就清晰明了了，我们可以分析第一组与第二组的评酒员对各样品酒给出的平均分数的离散度来判断谁的可信度高。

所谓离散度，即观测变量各个取值之间的差异程度。

它是用以衡量风险的大小及评价好坏的指标。

用这一概念来对每一组评酒员对酒做出的评价分数分析其离散度，即谁的离散度越大，他的可信度就越低，也就是说哪个组的评酒员给出分数的平均数方差大，则那个组的可信度就越低；对此，我们用Excel软件计算了各组评酒员对各种酒的平均值，再应用matlab软件根据公式：

就可以计算出各组评酒员对不同种类不同编号的葡萄酒酒的评价分数的方差的平方与各组的平均分数如下表

（1），表

（2）：

各种红酒的方差及平均值

红酒样品号

第一组方差

第二组方差

第一组平均数

第二组平均数

836.1

736.9

62.7

68.1

358.1

146

80.3

412.4

276.4

80.4

74.6

972.4

371.6

68.6

71.2

558.1

122.9

73.3

72.1

537.6

190.1

72.2

66.3

932.5

564.1

71.5

65.3

396.1

586

72.3

296.5

231.6

81.5

78.2

273

325.6

74.2

68.8

636.9

342.4

70.1

61.6

716.9

226.1

53.9

68.3

404.4

137.6

74.6

68.8

324

208.4

72.6

770.1

372.1

58.7

65.7

126.9

180.9

74.9

69.9

792.1

82.5

79.3

74.5

422.5

452.4

60.5

65.4

426.4

496.4

78.6

72.6

234.4

351.6

78.6

75.8

1044.9

319.6

77.1

72.2

255.6

218.4

77.2

71.5

292.4

222.9

85.6

77.1

674

96.5

71.5

581

393.6

69.2

68.2

281.6

374

73.8

448

184.5

71.5

表

（1）

各种白酒的方差及平均值

白酒样品号

第二组方差

第一组方差

第一组平均值

第二组平均值

232.9

830

77.9

441.6

1809.6

74.2

75.8

1282.4

598.1

85.3

75.6

378.9

402.4

79.4

76.9

235.5

1138

81.5

204.5

1464.4

68.4

75.5

379.6

352.5

77.5

74.2

280.1

1652.4

71.4

72.3

956.4

834.9

72.9

80.4

633.6

1914.1

74.3

79.8

790.4

1591.4

72.3

71.4

1260.4

1042.1

63.3

72.4

420.9

6.9

65.9

73.9

142.9

1028

77.1

486.4

1184.4

72.4

78.4

740.1

1602

67.3

346.1

1297.6

78.8

80.3

272.1

1408.9

73.1

76.7

234.4

417.6

72.2

76.4

450.4

574.8

77.8

76.6

579.6

1554.4

76.4

79.2

482.4

1248

79.4

104.4

392.9

75.9

77.4

346.9

1000.1

73.3

76.1

958.5

304.9

77.1

79.5

926.1

656.1

81.3

74.3

320

1299.6

84.3

228.4

724.1

64.8

79.6

表

（2）

根据表

（1）与表

（2）里面的方差数据，我们利用:

Excel软件的画图功能，画出了第一组与第二祖评酒员分别对于红葡萄酒酒和白葡萄酒的分数方差曲线，如下图图

（1）与图

（2）

图

（1）

图

（2）

根据表

（1）与表

（2）我们可以明显地分析出结论：

无论是白葡萄酒还是红葡萄酒，第一组的评酒员给的分数与第二组的评酒员给的分数都有显著单位差异且第一组的方差曲线几乎都比第二组高，这说明了第一组的评酒员的方差波动明显地比第二组大，也就是说第一组的评酒员对同一种酒给出的分数差别很大。

因此可以初步认为第一组的评酒员没有第二组的好；或者说没有第二组的可信度高。

（二）问题二

对于问题2，我们采用了主成分分析法，所谓朱晨分分析法，就是设法将原来众多具有一定相关性（比如P个指标），重新组合成一组相互无关的综合性指标来代替原来的指标，具体做法就是用F1（选取的第一个线性组合，即第一个综合指标）的方差来表达，即VarF1越大，表示F1包含的信息就越多，因此，在所有的线性组合中选取的F1应该是方差最大的。

故称F1为第一主成分。

如果第一主成分不足以代表原来Ｐ个指标的信息，再考虑选取F2即选取第二个线性组合，为了有效地反应原来的信息，

F1中已有的信息就不必再F2中出现，用数学语言表达就是要求Cov（F1，F2）=0，则称F2为第二主成分，以此类推，我们可以构造出第三，第四，第五…，第P主成分。

（2）主成分分析的数学模型

其中a1,a2,a3……am为X的协方差矩阵的特征值对应的特征向量，ZX1,ZX2……,ZXp，原始变量经过标准处理后的值，因为在实际应用中，往往存在指标的量纲不同，所以在计算之前必须先消除量纲的影响，而将原始数据标准化。

A=（aij）=（a1，a2，…，am），Ra1=

a1，R为相关系数矩阵，

iai是相应的特征值与单位特征向量，

……

0。

根据以上模型，我们对附表2中的氨基酸总量，花色苷，柠檬酸等29组数据用spss软件进行了降维及因子分析处理，并且得出了它解释的总方差和成分矩阵，如下：

表3解释的总方差

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

7.302

25.179

7.302

25.179

3.656

12.608

37.787

3.656

12.608

37.787

2.798

9.649

47.436

2.798

9.649

47.436

2.203

7.597

55.034

2.203

7.597

55.034

1.774

6.118

61.152

1.774

6.118

61.152

1.639

5.651

66.803

1.639

5.651

66.803

1.391

4.796

71.599

1.391

4.796

71.599

1.105

3.809

75.408

1.105

3.809

75.408

.941

3.244

78.652

.869

2.998

81.650

.706

2.435

84.085

.659

2.273

86.358

.652

2.248

88.606

.614

2.117

90.724

.531

1.832

92.555

.397

1.368

93.923

.334

1.152

95.076

.281

.971

96.046

.222

.765

96.811

.201

.692

97.503

.189

.652

98.155

.149

.515

98.671

.130

.447

99.118

.105

.362

99.480

.079

.271

99.752

.031

.107

99.858

.020

.067

99.926

.019

.065

99.990

.003

.010

100.000

提取方法：

主成份分析。

成份矩阵a

成份

氨基酸总量

.465

.510

-.227

.177

-.313

-.046

.271

-.018

蛋白质

.590

-.254

.101

.263

.005

.089

-.218

-.248

vc含量

-.028

-.319

.151

-.045

-.194

-.476

-.109

.008

花色苷

.828

-.146

.085

-.025

.381

.010

-.070

.140

酒石酸（g/L）

.038

.527

.315

.251

-.035

.079

.315

-.251

苹果酸（g/L）

.364

.048

-.101

-.347

.609

.055

.040

-.224

柠檬酸（g/L）

-.041

.345

.248

-.179

.153

.431

.184

-.510

多酚氧化酶

-.094

.004

.247

-.467

.213

.363

.225

.519

褐变度

.499

-.073

.281

-.422

.324

.036

-.165

-.055

DPPH自由基

.587

-.146

.210

.386

.019

-.084

.178

-.113

总酚

.857

-.176

.034

.330

.221

-.006

-.022

.024

单宁

.856

-.183

-.093

.087

.149

-.057

-.062

.065

葡萄总黄酮

.761

-.264

.042

.419

.202

.037

.028

-.022

黄酮醇（mg/kg）

.809

-.007

.209

-.226

-.397

.157

.072

.003

槲皮素（mg/kg）

.749

.010

.158

-.229

-.376

.225

.092

.015

山萘酚（mg/kg）

.458

-.116

.314

-.446

-.391

.045

-.100

-.149

异鼠李素（mg/kg）

.855

.002

.174

.052

-.244

-.046

.151

.098

总糖

.373

.617

-.489

.074

-.023

.049

-.036

.160

可溶性固形物

.411

.618

-.479

.024

.006

.155

-.034

.213

PH值

-.140

.356

.443

.616

-.170

-.067

-.025

.167

可滴定酸

.195

-.314

-.785

-.143

-.045

-.173

.338

-.147

固酸比

-.183

.521

.559

.162

.125

.310

-.294

.200

干物质含量

.467

.649

-.419

-.051

.084

.075

.020

.022

果穗质量

-.123

-.599

-.022

.283

-.081

.425

-.021

-.045

百粒质量

-.225

-.545

-.202

.041

-.129

.300

.267

.269

果梗比

.343

.023

.453

-.377

-.143

-.366

.351

.145

出汁率

-.052

-.198

.242

.251

.431

-.144

.577

.182

果皮质量

-.103

-.420

-.176

.139

-.188

.626

.161

-.029

果皮颜色L*

-.543

.288

.193

-.002

.070

-.042

.448

-.195

提取方法:

主成份。

a.已提取了8个成份。

表4成分矩阵

然后用spss软件把表四进行标准化处理，把标准化处理后的数据根据综合分析发法模型算出综合成分排名，综合排名高的，酿酒葡萄的质量就较好，由第一问我们得出的第二组更可信的结论，我们把酿酒葡萄分为三等：

优、良、差三等。

对应的分级如下：

表5样品等级表

红酒样品号

优

3,5,9,17,14,19,20,21,23,26,2

良

1，4,10,11,12,13,16,22,24,25.27

差

6,7,8,15,18

白酒样品号

优

5,9,17,10,28,25,22,21,15,1,23,14,27

良

4,18,2019,24,2,3,6,

差

26,7,13，12,8,11,16

参考文献：

【1】林海明，张文霖。

主成分分析与因子分析详细的异同和SPSS软件［Ｊ］统计研究　２００５

展开阅读全文