数学建模A葡萄酒的评价.docx
《数学建模A葡萄酒的评价.docx》由会员分享,可在线阅读,更多相关《数学建模A葡萄酒的评价.docx(40页珍藏版)》请在冰点文库上搜索。
![数学建模A葡萄酒的评价.docx](https://file1.bingdoc.com/fileroot1/2023-6/10/c4b0b8b5-1f53-44dc-a3af-400a699fe4ca/c4b0b8b5-1f53-44dc-a3af-400a699fe4ca1.gif)
数学建模A葡萄酒的评价
--本页仅作预览文档封面,使用时请删除本页--
数学建模A葡萄酒的评价(总27页)
2012高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
2012年9月7日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要
目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。
葡萄酒的质量与酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。
对于问题1,我们采用方差分析的方法建模解决。
基本思路是:
对两组评酒员的评价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第二组的结果更可信。
对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分级。
基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。
此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。
最终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。
对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。
对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。
文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应用和推广。
关键词:
方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验
1.问题的重述
确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
对问题1,我们对附件一所给的葡萄酒品尝评分表进行统计学分析,根据各组评酒员对同一种葡萄酒的评价结果算出每种酒样品的得分,并对每组的数据进行方差分析,利用F检验求出两组间的显着水平,并与的显着水平比较,从而判断两组评酒员的评价结果有无显着性差异。
确定哪组更可信时,分别求出两组评价结果的方差进行比较,方差越小,可信度也就越高。
对问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,属于分类问题。
对该问题,可以采用主成分分析法,建立综合评价模型。
选取附件2中关于葡萄的一级指标作为影响等级划分的因素,采用因子分析法,确定主成分,结合问题1所得出的葡萄酒的质量对酿酒葡萄进行综合评价并分级。
对问题3,分析酿酒葡萄与葡萄酒的理化指标之间的联系,既然是分析两指标之间的联系,就少不了作比较,从比较数据成对出现这一方面考虑,应该选取酿酒葡萄与葡萄酒理化指标中的共有指标进行分析,用一元线性回归模型求出对应指标之间的函数关系,进而确定酿酒葡萄与葡萄酒的理化指标之间的联系。
对问题4,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,参照问题2中酿酒葡萄的理化指标的处理方法,对葡萄酒的理化指标做同样分析。
加权处理得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量产生影响的综合因子E,根据葡萄酒质量排名和E排名比较出产生的影响大小。
3.模型的假设
(1)假设评酒员都有很高的品评资质,给出的评价结果客观可信。
(2)假设问题1中葡萄酒的质量只与评酒员的评分有关。
(3)假设更可信的评分组给出的数据可以代表葡萄酒的真实质量。
4.符号说明
符号一
方差
符号二
自由度
符号三
标准差
符号四
统计量
符号五
假定值
符号六
F临界值
符号七
F值实际显着性概率
符号八
对应的主成分值
符号九
总主成分值
符号十
因变量
符号十一
自变量
符号十二
综合因子
5.模型的建立与求解
5.1问题1的模型建立与求解
在评价结果采用百分制的前提下,对每一个品酒员所给出的每一种样品酒的评价结果求和,并求出每一组10名评酒员对同一种酒评价结果总分的平均值,此平均值即为本组针对该样品酒给出的评分,得到两组分别对27个红葡萄酒样品和28个白葡萄酒样品给出的评分。
用Excel中的数据分析对每组的数据进行方差分析,利用F检验判断两组评酒员的评价结果有无显着性差异。
方差分析结果如下:
(1)分析两组评酒员对红葡萄酒的评价
表
(1):
方差分析
方差分析:
单因素方差分析
SUMMARY
组
观测数
求和
平均
方差
列1
27
列2
27
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
1
组内
52
总计
53
因为统计量
,所以对红葡萄酒而言,两组评酒员的评价结果没有显着性差异。
因为第二组的方差远小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。
(2)分析两组评酒员对白葡萄酒的评价
表
(2):
方差分析
方差分析:
单因素方差分析
SUMMARY
组
观测数
求和
平均
方差
列1
28
列2
28
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
1
组内
54
总计
55
因为统计量
,所以对白葡萄酒而言,两组评酒员的评价结果没有显着性差异。
因为第二组的方差小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。
综上所述,两组评酒员的评价结果无显着性差异,且第二组的结果更可信。
5.2问题2的模型建立与求解
对于问题2,要求根据酿酒葡萄的理化标准及葡萄酒的质量,对酿酒葡萄进行分级,我们考虑红白两种酿酒葡萄及葡萄酒,建立模型,采运因子分析的方法进行主成分分析。
(1)首先对所给附件二的数据进行求平均值等优化处理,以便于进行运算。
为了对酿酒葡萄进行客观分级,采用主成分分析法,应用SPSS软件对数据进行因子分析,具体实施步骤如下:
1、数据的标准化
2、求出R及其特征值,贡献率
运用SPSS软件计算出相关矩阵R及其特征值,贡献率。
在主成分个数选取时,按照特征值大于1的原则,计算结果如下表:
表(3):
方差分解主成分提取分析表
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
2
3
4
5
6
7
8
9
.961
10
.738
11
.691
12
.514
13
.494
14
.372
15
.296
.986
16
.254
.846
17
.218
.728
18
.200
.668
19
.112
.375
20
.070
.234
21
.062
.206
22
.043
.143
23
.032
.108
24
.016
.053
25
.010
.034
26
.003
.012
27
28
29
30
由上表可知,有8种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前8个成分作为主要成分,即:
F1、……、F8。
然后求出成分矩阵,得出主成分的线性表达式。
8个主成分的成分矩阵如下表:
表(4):
成分矩阵
成份
1
2
3
4
5
6
7
8
总酚
.863
.224
.184
.088
花色苷
.847
.097
.196
.063
DPPH自由基
.756
.215
.114
.212
.114
单宁
.756
.246
.243
葡萄总黄酮
.719
.284
.031
.297
.124
.057
蛋白质
.614
.181
.272
.193
.081
果梗比
.583
.172
.088
.040
L*
.305
.050
.076
.345
黄酮醇
.558
.022
.028
.476
.216
出汁率
.545
.169
.016
.398
.015
百粒质量
.079
.269
.149
.222
.194
干物质含量
.375
.856
.094
.095
.054
.034
总糖
.256
.785
.261
.103
.297
还原糖
.079
.769
.128
.116
.073
可溶性固形物
.246
.760
.147
.121
.266
氨基酸总量
.375
.543
.016
.455
.167
白藜芦醇
.064
.818
.075
.165
.293
.294
果皮颜色
.278
.738
.052
.294
.257
.213
果皮质量
.325
.477
.221
b*
.488
.601
.191
.455
.295
.090
可滴定酸
.458
.220
.296
褐变度
.597
.054
.110
PH值
.270
.184
.696
.130
.240
苹果酸
.391
.321
.166
.087
.367
.117
多酚氧化酶活力
.313
.087
.235
.165
果穗质量
.067
.598
.044
.227
.093
VC含量
.094
.132
.160
固酸比
.396
.431
.534
.223
酒石酸
.381
.099
.367
.386
.312
.202
柠檬酸
.305
.190
.400
.356
.292
由上面表(4)可以看出:
总酚、花色苷、单宁、DPPH自由基、葡萄总黄酮、蛋白质、果梗比、黄酮醇、多酚氧化酶活力、出汁率和褐变度为第一主成分,干物质含量、总糖、还原糖、可溶性固体物、氨基酸总量和可滴定酸为第二主成分,白藜芦醇、果皮颜色、b*和柠檬酸为第三主成分,PH和酒石酸为第四种主成分,百粒质量、果穗质量、固酸比为第五主成分,苹果酸为第六主成分,果皮质量为第七主成分,VC含量、L*为第八主成分。
然后计算出8个主成分用原来指标表达出的线性关系式,其中各变量前的系数为表(4)中数据除以其对应主成分的特征值开平方得到,即:
(
为表(4)中相应特征值,
为主成分特征值)(所得系数见附录2)
(
为酿酒葡萄原始数据)
最后计算出综合指标,用8个主成分的贡献率分别乘以F1、F2、F3……F8的值得出最终的G值,其表达式如下:
由问题一得到的结果可知,第二组的评价结果更可信,所以,该问题建模时使用第二组的评分作为葡萄酒质量的依据,因为酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,故两者之间有着很强的相互依赖关系。
综合考虑酿酒葡萄的理化标准和葡萄酒的质量来对酿酒葡萄进行分级。
分级见下表:
表(5):
对酿酒红葡萄的分级
红葡萄
F
按F排名
酒质量评分
按酒质量排名
名次之和
综合排名
等级
葡萄样品3
1
4
5
1
Ⅰ
葡萄样品23
9
2
11
2
Ⅱ
葡萄样品21
2
9
11
3
Ⅱ
葡萄样品9
12
1
13
4
Ⅱ
葡萄样品19
6
7
13
5
Ⅱ
葡萄样品20
11
3
14
6
Ⅱ
葡萄样品22
4
12
16
7
Ⅱ
葡萄样品2
15
74
6
21
8
Ⅲ
葡萄样品17
19
5
24
9
Ⅲ
葡萄样品12
5
19
24
10
Ⅲ
葡萄样品6
3
22
25
11
Ⅲ
葡萄样品5
18
10
28
12
Ⅲ
葡萄样品4
14
15
29
13
Ⅲ
葡萄样品18
7
25
32
14
Ⅳ
葡萄样品14
25
8
33
15
Ⅳ
葡萄样品24
20
13
33
16
Ⅳ
葡萄样品7
8
26
34
17
Ⅳ
葡萄样品16
21
16
37
18
Ⅳ
葡萄样品1
16
21
37
19
Ⅳ
葡萄样品15
13
24
37
20
Ⅳ
葡萄样品11
10
27
37
21
Ⅳ
葡萄样品26
27
72
11
38
22
Ⅳ
葡萄样品13
22
17
39
23
Ⅳ
葡萄样品27
26
14
40
24
Ⅴ
葡萄样品8
17
66
23
40
25
Ⅴ
葡萄样品10
24
18
42
26
Ⅴ
葡萄样品25
23
20
43
27
Ⅴ
对本问题分析不能直接证明酿酒葡萄的好坏与葡萄中某些物质如氨基酸、蛋白质的含量多少等因素直接相关,由于酿酒葡萄的理化标准是按主成分分析得出的,其F值不能与葡萄酒质量的评分直接叠加使用进行综合排名,加之葡萄酒质量除与酿酒葡萄的好坏直接相关。
我们进行了主成分分析F值的排名和根据葡萄酒的质量进行两种排名。
对于综合排名分级,我们为了避免讨论两者所占的权重,采取了两种排名名次的求和重新进行排名分级,结果显得更加客观。
最后,我们以10作为区间长度,将葡萄分为五个等级。
(2)同理,我们对酿酒白葡萄运用SPSS软件进行主成分分析,取特征值大于1的因子作为主成分,得出的主成分提取分析表如下:
表(6):
方差分解主成分提取分析表
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
2
3
4
5
6
7
8
9
10
11
.967
12
.863
13
.639
14
.602
15
.396
16
.345
17
.303
18
.279
.930
19
.176
.585
20
.117
.391
21
.096
.320
22
.064
.213
23
.051
.171
24
.023
.077
25
.014
.047
26
.008
.026
27
.003
.010
28
29
30
由上表可知,有10种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前10个成分作为主要成分。
各主成分的的成分矩阵如下:
表(7):
成分矩阵
成份
1
2
3
4
5
6
7
8
9
10
干物质含量g/100g
.835
.105
.155
.114
.222
可溶性固形物g/l
.802
.297
.067
.162
总糖g/L
.756
.018
.037
.082
.169
还原糖g/L
.721
.004
.164
.276
.245
.073
果皮颜色b*
.646
.152
.004
.275
.044
.107
氨基酸总量
.592
.111
.181
.532
.061
.126
.070
.164
出汁率(%)
.204
.216
.210
.173
果穗质量/g
.478
.278
.226
.057
.179
L*
.519
.366
.357
.091
单宁(mmol/kg)
.472
.372
.231
.260
.319
百粒质量/g
.301
.282
.113
.328
.265
多酚氧化酶活力
.305
.372
.135
总酚(mmol/kg)
.071
.763
.465
.221
.167
.050
葡萄总黄酮(mmol/kg)
.002
.763
.502
.132
.202
.094
蛋白质
.224
.640
.232
.004
.273
.011
固酸比
.151
.583
.127
.024
.146
可滴定酸(g/l)
.625
.286
.059
.092
.212
.205
酒石酸
.342
.019
.223
.410
.435
.329
DPPH自由基1/IC50(g/L)
.435
.452
.198
.278
花色苷
.129
.279
.187
.238
.302
.308
果皮颜色a*
.576
.003
.281
.276
VC
.014
.133
.305
.139
.215
.006
黄酮醇(mg/kg)
.270
.288
.501
.441
.068
.081
.283
.260
.083
果梗比(%)
.117
.342
.065
.312
.337
果皮质量(g)
.368
.371
.220
.351
.129
.299
.177
苹果酸
.133
.386
.101
.610
.389
.149
.281