最后的论文.docx

上传人:b****1 文档编号:2530754 上传时间:2023-05-03 格式:DOCX 页数:27 大小:481.85KB
下载 相关 举报
最后的论文.docx_第1页
第1页 / 共27页
最后的论文.docx_第2页
第2页 / 共27页
最后的论文.docx_第3页
第3页 / 共27页
最后的论文.docx_第4页
第4页 / 共27页
最后的论文.docx_第5页
第5页 / 共27页
最后的论文.docx_第6页
第6页 / 共27页
最后的论文.docx_第7页
第7页 / 共27页
最后的论文.docx_第8页
第8页 / 共27页
最后的论文.docx_第9页
第9页 / 共27页
最后的论文.docx_第10页
第10页 / 共27页
最后的论文.docx_第11页
第11页 / 共27页
最后的论文.docx_第12页
第12页 / 共27页
最后的论文.docx_第13页
第13页 / 共27页
最后的论文.docx_第14页
第14页 / 共27页
最后的论文.docx_第15页
第15页 / 共27页
最后的论文.docx_第16页
第16页 / 共27页
最后的论文.docx_第17页
第17页 / 共27页
最后的论文.docx_第18页
第18页 / 共27页
最后的论文.docx_第19页
第19页 / 共27页
最后的论文.docx_第20页
第20页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

最后的论文.docx

《最后的论文.docx》由会员分享,可在线阅读,更多相关《最后的论文.docx(27页珍藏版)》请在冰点文库上搜索。

最后的论文.docx

最后的论文

葡萄酒的评价

摘要

本文主要针对酿酒葡萄的好坏和所酿葡萄酒的质量进行分析,并根据葡萄酒和酿酒葡萄检测的理化指标建立模型以确定葡萄酒的质量,更好的研究酿酒葡萄和葡萄酒的理化指标与葡萄酒之间的关系以及对葡萄酒质量的影响。

文中采取的方法是运用系统聚类法将数据进行处理,结合SPSS软件绘制出相关的图形,在简化问题的同时能精确,直观的判断各指标之间的关系,从而达到解决问题的目的。

对于问题一:

分析两组评酒员的评价结果有无显著差异性,就是看两组评酒员分别对每个样品做出评价后所给分数进行处理以及绘图分析后图像的差异性,运用Excel,Matlab分别求出每组中所有评酒员对每个样品所给分数的平均值并绘制方差图像。

最后,通过所绘图形,从宏观的角度加以说明,以此判断小组结果的可靠性。

对于问题二:

要想对酿酒葡萄进行分级,本文从酿酒葡萄的理化指标和葡萄酒的质量入手,运用聚类分析里面的系统聚类法和K均值法,统计学原理将酿酒葡萄的理化指标分成三类,葡萄酒的质量分成三个等级,通过数据拟合,分别将红葡萄和白葡萄分成相应的等级。

对于问题三:

主要采用降维技术即主成分分析法,分别将酿酒葡萄和葡萄酒的理化指标化为少数几个综合指标,用新的变量代替原来的多个变量,并使这几个变量尽可能多的保留原来较多的变量所反映的信息。

通过SPSS软件分别绘制出酿酒葡萄与葡萄酒理化指标之间的图像,达到简化问题的目的。

对于问题四:

结合第三问的结论,利用k-均值法借助于SPSS软件分别用酿酒葡萄的理化指标和葡萄酒的理化指标对葡萄酒进行分级与评酒员所给分数对应的分级进行比较。

若所得结果从直观上满足一定的统计关系,则证明能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,否则,不能论证。

关键词:

系统聚类法,K-均值法,主成分分析法,SPSS软件

 

一.问题的提出

葡萄酒除了含有葡萄果实的营养外,还有发酵过程中产生的有益成分。

研究证明,葡萄酒中含有200多种对人体有益的成分,其中包括糖,有机酸,氨基酸,维生素,多酚,无机盐等。

这些成份都是人体所必需的,对于维持人体的正常生长,代谢是必不可少的。

给葡萄酒评分对葡萄酒市场的影响很大,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

本论文针对不同种类的酿酒葡萄,葡萄酒以及酿酒葡萄的检测指标,利用已知的评价结果和成分数据进行分析,通过聚类分析法,主成分分析法等方法,最终准确分析酿酒葡萄和葡萄酒理化指标之间的联系,并对酿酒葡萄进行分级。

考虑了各项理化指标等因素,通过建立的统计基础模型,借助于计算机的高速运算与逻辑判断能力,判断结果的可靠性。

主要解决的问题如下:

(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。

(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二.问题的分析

2.1小组结果差异性和可信度的判断

要想找出两组评酒员对样品酒的评价结果有无差异性及哪组更为可信度,就得先求出每组瓶酒员对样品酒的评价结果。

再根据两组评酒员给出的评价结果,通过一定的数据处理及统计分析确定差异性和可信度。

样品评价结果涉及到十个不同的评酒员给出的评分,要求其平均值才能确定每种样品的最后评价,即:

设Aij为第j个评酒员对第i个样品给出的总分,所以(i=1,2,3...,28;j=1,2,3...,10)则第i个样品酒的评价结果为:

根据求出的Bi绘图,就能找出两组评酒员给出的评价有无明显差异性。

设每十个评酒员对第i个样品酒做出结果的方差:

根据求出的Ci绘图,确定哪组评酒员的评价更有可信度。

2.2葡萄等级的分类方法

要想将酿酒葡萄进行分级,就要从酿酒葡萄的理化指标和葡萄酒的质量入手,将酿酒葡萄的理化指标分成三部分,通过评酒员给所有样品的分数按大小排列后将葡萄酒分成三个等级,二者结合后找出相同的葡萄酒样品,对应的就是相应的酿酒葡萄的分级。

2.2.1系统聚类法

系统聚类法的基本原理:

首先将一定数量的样本或指标各自看成一类,然后根据样本(或指标)的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。

重复这一过程,直到将所有的样本(或指标)合并为一类。

系统聚类分为Q型聚类和R型聚类两种:

Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,降低变量维度的目的。

本问进行的是Q型聚类。

类与类之间距离的计算方法主要有一下几种:

(1)最短聚类法,是指两类之间每个个体距离的最小值。

(2)最长距离法,是指两类之间每个个体距离的最大值。

(3)组间连接法,是指两类之间个体之间距离的平均值。

(4)组内连接,是指把两类所有个体之间的距离都考虑在内。

(5)重心距离法,是指两个类中心点之间的距离。

(6)离差平方和法(ward法),同类样品的离差平方和应当较小,类与类之间的离差平方和应当较大。

2.2.2K-均值法(快速聚类法)

k-均值法(又称快速聚类法),是由MacQueen于1967年提出的,它将数据看成K维空间上的点,以距离作为测度个体“亲疏程度”的指标,并通过牺牲多个解为代价换得高的执行效率。

但是,k-均值法只能产生制定类数的聚类结果,而类数的确定离不开实践经验的积累。

快速聚类分析的基本思想是:

首先按照一定方法选取一批凝聚点(聚心),再让样本向最近的凝聚点凝聚,形成初始分类,然后再按最近距离原则修改不合理的分类,知道合理为止。

因此,在快速聚类中,应首先要求用户自行给出需要聚成多少类,最终也只能输出关于它的唯一解。

快速聚类是一个反复迭代的分类过程,在聚类过程中,样本所属的类会不断调整,直到最终达到稳定为止。

2.2.3酿酒葡萄和葡萄酒理化指标之间的分析

由附件2可以看出两种葡萄和葡萄酒的理化指标,根据主成分分析法,取单宁,总酚,酒总黄酮等所有的理化指标为研究对象,每个研究对象又是多要素的复杂系统。

这些变量增加了问题的复杂性和难度,为了简化问题我们采用主成分分析法,原理如下:

假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵,

 

记原变量指标为x1,x2,…,xp,设它们降维处理后的综合指标,即新变量为z1,z2,z3,…,zm(m≤p),则

 

系数lij的确定原则:

①zi与zj(i≠j;i,j=1,2,…,m)相互无关;

②z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP的所有线性组合中方差最大者。

新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。

从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的荷载lij(i=1,2,…,m;j=1,2,…,p)。

从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。

2,2.4各项理化指标对葡萄酒质量的影响

在第三问的基础上,用k均值法对两种酿酒葡萄的理化指标和葡萄酒进行分级,运用SPSS软件后可将酿酒葡萄的理化指标和葡萄酒的理化指标分成三个等级,在第一问的基础上结合评酒员所给分数的等级进行比较,从而得出结论。

三.模型的假设

(1)忽略非主成分对葡萄质量的影响。

(2)不考虑二级理化指标对葡萄质量以及分级的影响。

(3)假设除附件所提供的理化性质外,其他因素不会对葡萄和葡萄酒的质量造成影响。

四.符号说明

Aijj个评酒员对第i个样品给出的总分

Bi第i个样品酒的评价结果

Ci每组十个评酒员对第i个样品酒做出结果的方差

Vi个样品第i个理化性质含量

Xij其中i=1为白葡萄,i=2为红葡萄,i=3为白葡萄酒,i=4为红葡萄酒;j为该组中第j种主成分)

五.模型的建立及求解

问题一

附件一给出了两组评酒员的评价结果,为了准确描述哪组结果可信度更高,按照附件一所给的数据。

在每组数据中,我们用Excel分别对本组每个样品的所有评酒员所给分数求平均值,用平均数达到简化数据的同时又能客观的表现数据之间的差异性,通过拟合平均数的图像来比较两组评酒员评价结果的显著。

其中data1表示第一组红酒,data2表示第二组红酒,data3表示第一组白酒,data4表示第二组白酒。

如图1所示

 

分数均值图

图1

从上图可以直观的看出两组之间评价结果存在很显著的差异性,为了了解哪组结果更可信,我们以样本为x轴,运用Matlab绘制出两组评酒员分别对红葡萄酒和白葡萄酒所评分数的方差图,其中data1表示第一组红酒,data2表示第二组红酒,data3表示第一组白酒,data4表示第二组白酒。

根据图像的波动性来判断结果的可信度,如图2所示

分数方差图

图2

从上图可以直观的看出红色和蓝色绘制的折线图代表的第一组评酒员所给分数波动较之于绿色和黄色的折线图代表的第二组评酒员所给分数要大,相对来说稳定性不高。

二者比较来看,第二组评酒员的评价结果更可信。

问题二

运用聚类分析里面的聚类法和k-均值分析,借助于SPSS软件将酿酒葡萄的理化指标分成三类,如下图所示

 

图3白葡萄样本聚类图图4红葡萄样本聚类

图3冰柱图表示的是白葡萄样本的聚类情况,图4表示的是红葡萄样本的聚类情况。

我们可以试着将每种葡萄的所有样本分成三级,为了更直观的看出所有样本的分类,我们借助SPSS软件使用“组间连接”6种聚类方法生成的树状聚类图来证明我们分类的准确性和完整性。

 

图5

图6

 

图5表示的是白葡萄使用平均连接(组间)的树状图,图6表示的是红葡萄使用平均连接(组间)的树状图,两种葡萄其他5种树状图详见附录。

纵观不同的聚类方法,比较其聚类结果,可总结两种葡萄的分级结果如下表所示(每个数字均代表相应的样品)。

 

聚类方法

聚类结果

第一类

第二类

第三类

组间联接法

12,18,6,7,4,25,27,5,24,17,15,

13,19,16,10,12,22,20,26

8,14,2,9,23,1,3,11

组内联接法

12,18,6,27,7,4,25,5,2417,15

16,10,13,19,14,21,22,20,26,38,11

2,9,23,1

单联接法

12,18,6,5,24,27

4,25,27,16,10,15,20,7,13,19,26,14,21,22,8

2,9,23,1,3,11

完整联接法

12,18,6,7,4,25,5,24,17,15

21,22,20,26,16,27,13,19,10,11

8,14,1,2,9,23,3

质心联接法

12,8,6,5,24,17,27,4,15,7

19,25,16,13,21,14,22,10,20,26,2,9,23,

1,3,8,11

中位数联接法

12,18,65,24,17,27,4,

25,

15,7,19,13,21,1622,20,26,10,8,14,2,9

23,1,3,11

Ward法联接法

4,5,6,7,10,11,12,13,15,17,18,20,22,24,25,26,27,

14,21,19,16

1,3,23,2,8,9

红葡萄聚类分析结果

聚类分析结果为第一级样品4,5,6,7,12,15,17,18,24,25,27,

第二级样品10,12,13,16,19,20,21,22,26,

第三级样品1,2,3,8,9,11,14,23,

 

 

白葡萄聚类分析结果

聚类方法

聚类结果

第一级

第二级

第三级

组间联接法

7,18,6,15,1,13,19,20

17,22,14,23,21,5,

10,12,2,25,4,28,9,26,

8,11,16,24,27,3

组内联接法

7,18,6,15,1,13,8,11,16,19

14,23,2,26,10,12,25,22,5,20,4,28,9

3,17,21,24,27

单联接法

7,18,6,10,12,4,28,14,

23,26,2,25,

5,20,9,19,16,17,8,11,

22,15,21

24,3,1,13,27

完整联接法

7,18,6,15,1,13,16,19,,,11,17,22

24,27,5,20,14,23,21,4,28,9,26,8

10,12,2,25,3,

质心联接法

7,18,6,5,20,14,23,2,4,10,12,26,25,28,9,22

17,11,21,16,19,8,3,1,

15,13,24,27

中位数联接法

7,18,6,5,20,14,23,10,12,25,26

9,4,28,3,22,17,8,11,9,16,1,13,2

15,21,24,27,

Ward法联接法

7,18,6,15,1,13,8,11,16,19

24,27,10,12,2,25,3,17,22,14,23,21,

5,20,4,28,9,26

 

聚类分析结果为第一级样品1,6,7,11,13,14,18,19,20,23,25,

第二级样品2,4,5,8,9,10,12,16,17,21,22,26,28

第三级样品3,15,24,27

问题三

运用主成分分析法,利用SPSS软件分别将2种葡萄与2种葡萄酒的理化指标进行处理。

绘制出的图形详见下图,成分矩阵见附录主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。

特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。

 

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

3.046

50.761

50.761

3.046

50.761

50.761

2

1.108

18.469

69.230

1.108

18.469

69.230

3

.803

13.383

82.613

.803

13.383

82.613

4

.629

10.477

93.090

.629

10.477

93.090

5

.309

5.155

98.245

.309

5.155

98.245

6

.105

1.755

100.000

.105

1.755

100.000

提取方法:

主成份分析。

 

 

由上表可知提取了3个主成分,即m=3

 

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

5.248

74.966

74.966

5.248

74.966

74.966

2

1.098

15.686

90.652

1.098

15.686

90.652

3

.373

5.333

95.985

.373

5.333

95.985

4

.156

2.227

98.212

.156

2.227

98.212

5

.059

.836

99.047

.059

.836

99.047

6

.036

.513

99.560

.036

.513

99.560

7

.031

.440

100.000

.031

.440

100.000

提取方法:

主成份分析。

 

 

由上表可知提取一个主成分,即m=1

 

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

5.581

18.602

18.602

5.581

18.602

18.602

2

4.505

15.017

33.619

4.505

15.017

33.619

3

3.580

11.932

45.551

3.580

11.932

45.551

4

2.214

7.379

52.930

2.214

7.379

52.930

5

1.892

6.306

59.237

1.892

6.306

59.237

6

1.684

5.615

64.851

1.684

5.615

64.851

7

1.595

5.318

70.169

1.595

5.318

70.169

8

1.343

4.476

74.646

1.343

4.476

74.646

9

1.211

4.035

78.681

1.211

4.035

78.681

10

1.115

3.717

82.397

1.115

3.717

82.397

11

1.065

3.549

85.946

1.065

3.549

85.946

12

.980

3.267

89.213

.980

3.267

89.213

13

.898

2.993

92.206

.898

2.993

92.206

14

.655

2.183

94.389

.655

2.183

94.389

15

.388

1.294

95.683

.388

1.294

95.683

16

.348

1.158

96.841

.348

1.158

96.841

17

.229

.762

97.604

.229

.762

97.604

18

.195

.652

98.255

.195

.652

98.255

19

.179

.597

98.852

.179

.597

98.852

20

.122

.405

99.257

.122

.405

99.257

21

.077

.257

99.514

.077

.257

99.514

22

.067

.222

99.737

.067

.222

99.737

23

.039

.130

99.867

.039

.130

99.867

24

.020

.066

99.933

.020

.066

99.933

25

.014

.048

99.981

.014

.048

99.981

26

.004

.014

99.995

.004

.014

99.995

27

.001

.005

100.000

.001

.005

100.000

28

3.859E-16

1.286E-15

100.000

29

4.568E-17

1.523E-16

100.000

30

-1.351E-16

-4.502E-16

100.000

提取方法:

主成份分析。

 

由上表可知有十种主成份,即m=10

 

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

6.968

23.228

23.228

6.968

23.228

23.228

2

4.941

16.471

39.698

4.941

16.471

39.698

3

3.734

12.447

52.145

3.734

12.447

52.145

4

2.840

9.468

61.613

2.840

9.468

61.613

5

2.000

6.666

68.279

2.000

6.666

68.279

6

1.741

5.805

74.084

1.741

5.805

74.084

7

1.419

4.729

78.813

1.419

4.729

78.813

8

1.269

4.231

83.044

1.269

4.231

83.044

9

.961

3.205

86.248

.961

3.205

86.248

10

.738

2.459

88.708

.738

2.459

88.708

11

.691

2.302

91.010

.691

2.302

91.010

12

.514

1.713

92.723

.514

1.713

92.723

13

.494

1.646

94.369

.494

1.646

94.369

14

.373

1.243

95.612

.373

1.243

95.612

15

.295

.983

96.595

.295

.983

96.595

16

.254

.846

97.441

.254

.846

97.441

17

.218

.726

98.168

.218

.726

98.168

18

.200

.667

98.835

.200

.667

98.835

19

.112

.373

99.208

.112

.373

99.208

20

.071

.237

99.445

.071

.237

99.445

21

.061

.205

99.650

.061

.205

99.650

22

.043

.143

99.794

.043

.143

99.794

23

.032

.108

99.902

.032

.108

99.902

24

.016

.053

99.955

.016

.053

99.955

25

.010

.034

99.989

.010

.034

99.989

26

.003

.011

100.000

.003

.011

100.000

27

3.735E-16

1.245E-15

100.000

28

1.130E-17

3.768E-17

100.000

29

-1.702E-16

-5.674E-16

100.000

30

-2.299E-16

-7.662E-16

100.000

提取方法:

主成份分析。

由上表可知提取八个主成分,即m=8.

通过上图(方差分解主成分提取分析)可知,白葡萄提

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2