葡萄酒的评价数学建模论.docx
《葡萄酒的评价数学建模论.docx》由会员分享,可在线阅读,更多相关《葡萄酒的评价数学建模论.docx(20页珍藏版)》请在冰点文库上搜索。
![葡萄酒的评价数学建模论.docx](https://file1.bingdoc.com/fileroot1/2023-5/15/2811486f-4834-4a4a-aaa4-f202688c577b/2811486f-4834-4a4a-aaa4-f202688c577b1.gif)
葡萄酒的评价数学建模论
葡萄酒的评价
摘要
本文主要研究葡萄酒的评价问题。
以酿酒葡萄和葡萄酒为对象,通过对酿酒葡萄理化指标的分析、分级,筛选出影响葡萄酒质量的主要指标,就酿酒葡萄和葡萄酒理化指标、芳香物质对葡萄酒质量进行分析研究,从而得出对葡萄酒质量的客观评价。
问题一,我们发现有两组数据是有误的,最后我们取平均值代替,再对两组葡萄酒的数据进行处理,通过t检验征得有显著性差异,然后利用alpha模型来得出第二组比较可信。
问题二,第一问所得的可信组,用EXCLE先计算酿酒葡萄的显著性理化指标的相关系数,然后在按他们的分数给这些指标按分数分级,最后算出各样品的和按分数再给各样品分级。
问题三,以葡萄酒的评分表示质量的优劣程度,将酿酒葡萄、葡萄酒分别与质量计算相关系数,筛选出相关系数较大的指标,然后用酿酒葡萄和葡萄酒中选出的指标做相关性分析,从而得到酿酒葡萄与葡萄酒理化指标的联系。
问题四,根据第三问中酿酒葡萄与葡萄酒显著的理化指标,分别与葡萄酒的质量(评分)建立多元回归方程,再对芳香物质进行显著性分析,发现芳香物质也是影响葡萄酒的重要因素,故分析葡萄酒的质量需要考虑芳香物质的影响。
关键词:
t检验alpha模型相关性分析
一、问题重述
1.1问题背景
葡萄酒的生产有着非常久远的历史,可上溯至几千年前,它是一种世界通畅性酒种,有着广泛交流的基,现已发展成最重要的酒种之一。
葡萄酒的感官分析又叫品酒、评酒,是指评酒员通过眼、鼻、口等感觉器官对葡萄酒的外观、香气、滋味及典型性等感官特性进行分析评定的一种分析方法。
一方面,评酒员必须要抛开个人喜好,排除时间、地点、环境和情绪等的影响,像一台精密的仪器一样进行感官分析;另一方面,因为葡萄酒的复杂多样及变化性,评酒员又必须充分发挥主观能动性,将获得的感觉与大脑中贮存的感官质量标准进行比较分析。
只有兼顾以上两个方面,才能保证结果的精确性。
同时各个评酒员之间还必须保证分析结果的一致性。
一致性和精确性是正确性的保证。
1.2提出问题
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析
2.1问题一的分析
问题一评价两组评酒员的评价结果的显著性以及可靠性。
首先要考虑每组评酒员对同一酒样品的评价是否满足正态分布,然后把它看着单样本t检验,从而判断两组评酒员的评价结果有无显著性差异。
在建立alpha模型来判断可信度,alpha值越大,可信度越大。
2.2问题二的分析
问题二是根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
先对酿酒葡萄的理化指标计算相关系数,筛选出相关系数较大的指标,用EXCLE对每一个指标进行排序,分类,按照建立的评分规则对每一个葡萄样品进行评分,最后按照汇总后的评分将葡萄样品分级即可。
2.3问题三的分析
问题三是分析酿酒葡萄与葡萄酒的理化指标之间的联系。
先计算葡萄酒的理化指标与葡萄酒质量(评分)的相关系数,选出相关系数较大的指标;用葡萄酒的质量即评分作为连接葡萄酒与酿酒葡萄的桥梁,使用SPSS对酿酒葡萄、葡萄酒中显著的理化指标进行相关分析,根据结果分析二者之间的联系。
2.4问题二的分析
问题四是分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
首先对酿酒葡萄、葡萄酒分别和葡萄酒质量建立多元回归方程,根据所得结果分析影响;要论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只需用SPSS对芳香物质各指标与评分做相关分析,根据结果来论证是否有影响。
三、模型假设
(1)两组葡萄出自同一地方;
(2)两组葡萄酒都是由同样的酿酒师酿造出来的,且排除他们的非系统性误差;
(3)酿酒葡萄和葡萄酒的贮存方式、条件都是一样的;
(4)排除评酒员在评价过程中视觉、嗅觉、味觉等产生的误差。
四、符号及变量说明
第一组红葡萄酒的样品平均值
第二组红葡萄酒的样品平均值
两组各个红葡萄酒样品的差值
建立的t检验的表达式
假设z变量的均值为0
DPPH自由基1/IC50(g/L)
总酚(mmol/kg)
葡萄总黄酮(mmol/kg)
PH值
蛋白质
果皮颜色a*
果皮颜色b*
m1
单宁
m2
总酚
m3
酒总黄酮
m4
白藜芦醇
m5
DPPH半抑制体积
m6
L*
n1
酒石酸
n2
总糖
n3
可溶性固形物
n4
果穗
n5
果质颜色
q1
酒总黄酮
q2
白藜芦醇
q3
DPPH半抑制体积
q4
L*
q5
b*
五、模型的建立与求解
(一)问题一的解决
问题:
分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结信?
通过对数据的整理,我们发现在附件一中存在两处错误:
首先对有误数据的处理:
(1)第一组红葡萄酒品尝评分中,酒样品20的品酒员4号的外观分析中的色调一栏中的数据丢失,所以用均值填充,即为6.2
(2)第一组白葡萄酒品尝评分中,酒样品3的品酒员7号的口感分析中
久性一栏数据错误,所以用均值填充,即为6.1。
首先利用Excel求出红色葡萄酒的的综合均值
然后再利用spss做p-p图进行正态分布检验,若样品点再正态分布p-p图上呈直线分布,则被检验数据基本上成一条直线。
分布满足正态
分布满足正态
5.1.1显著性差异的确定
现在两组的红葡萄酒分布符合正态分布再进行t检验,因为两种葡萄酒的样品都小于30,故可以用t检验。
通过
我们得到两组葡萄酒的个样品品评总分的均值为
和
。
将两个变量配对进行
检验。
要我们引入一个新的随机变量
对应样本的值为
,样本方差
。
这样,配对
检验的问题就转化为单样本
检验问题即转化为检验的均值是否与0有显著差异。
首先我们建立原假设为
:
然后构造
统计量为:
用spss进行单样本检验,得到红葡萄酒:
用spss进行单样本检验,得到白葡萄酒:
由于两组的Sig的值都小于0.05,所以故拒绝原假设,说明存在显著性差异。
5.1.2可信度问题的解决
对于可信度问题,我们建立相应的alpha模型,做可信度分析时,将两组的27种酒样品评价结果组成两组评价总矩阵,以葡萄酒的评价指标为列项,共10列,以每个评酒员作为横向量,共270行,分别用SPSS19.0对两组矩阵进行信度分析,目的是对量表的可靠性与有效性进行检验,判断出哪一组可信度更高。
克伦巴赫
系数:
测度内部一致性的一个指标,
与皮尔逊
系数都是一样的范围在0—1之间,如果为负值则表明表中某些项目的内容是其他一些项目的反面;
越接近于1,则量表中项目的内部一致性越是高,可信度越大
用spss来alpha分析得:
第一组红葡萄酒可靠性统计量
第二组红葡萄酒可靠性统计量
基于标准化项的
项数
基于标准化项的
项数
.750
.786
270
.874
.906
270
第一组白葡萄酒可靠性统计量
第二组白葡萄酒可靠性统计量
基于标准化项的
项数
基于标准化项的
项数
.820
.866
280
.855
.886
280
因为第二组的红葡萄酒的alpha值>第一组的红葡萄酒的alpha值,故第二组的可信度高。
因为第二组的白葡萄酒的alpha值>第一组的白葡萄酒的alpha值,故第二组的可信度高。
(二)问题二的解决
问题:
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级
附件2中测定了27个红葡萄样品的59个理化指标,其中有30个一级指标,29个二级指标。
5.2.1用双变量分析相关性很强的变量且按等分进行分级
首先用SPSS对所有的酿酒红葡萄的理化指标与红葡萄酒的质量分数进行相关分析,即导入数据—分析—相关—双变量,结果见附录一。
由附录一的显著性检验可得:
DPPH自由基,总酚,葡萄总黄酮,PH值,蛋白质跟红酒的质量显著性相关,且正相关,即含量越多质量越好。
果皮颜色a*,果皮颜色b
*跟红酒的质量呈负相关,即含量越少红葡萄酒质量越好。
对以上七个指标排序,将葡萄酒分成四个等级,即优、良、中、差,结果如下:
5.2.2将各变量得分相加把葡萄酒按得分进行分级
给出对应优、良、中、差的等级分分别为4、3、2、1,将每一个酒样品的等级分求和,并将最后的总和按照已经建立的等级规则分为四类。
得红葡萄酒的分级为:
对于白葡萄酒我们同理:
首先我们发现白葡萄酒没有花色苷,经过我们查资料发现它对葡萄酒的质量没有影响。
故同理可得:
酿酒白葡萄的理化指标与白葡萄酒的质量分数的相关分析,结果见附录二.
由附录二的相关性检验可得:
酒石酸、总糖、可溶性固形物、果穗质量、果皮颜色b*与白酒质量显著性相关,且酒石酸、总糖、可溶性固形物、果皮颜色b*呈正相关,果穗质量与白酒质量呈负相关。
所以以这五个指标作为分级标准,将白葡萄酒分为优、良、中、差四个等级,结果如下:
综上:
得白葡萄样品的分级:
(三)问题三的解决
问题:
分析酿酒葡萄与葡萄酒的理化指标之间的联系。
5.3.1酿酒葡萄与红葡萄酒的理化指标的关系
在此问中,我们要用到酿酒葡萄和葡萄酒中几个与葡萄酒质量密切相关的理化指标。
在第二问中我们知道酿酒红葡萄DPPH自由基,总酚,葡萄总黄酮,PH值,蛋白质、果皮颜色a*、果皮颜色b*跟红酒质量显著性相关,现在我们需要求出红葡萄酒中对葡萄酒质量影响较为显著的理化指标。
求出红葡萄酒的指标与红葡萄酒的质量分数的相关系数,如下表4.3.1.选出相关系数相对较高的前六个指标,分别为:
单宁(mmol/L)、总酚(mmol/L)、酒总黄酮(mmol/L)、白藜芦醇(mg/L)、DPPH半抑制体积(IV50)1/IV50(uL)、L*(D65)。
表4.3.1红葡萄酒的理化指标与红酒质量的相关系数
用上述得到的葡萄酒的六个指标与第二问得到的酿酒葡萄的七个指标做相关分析,结果参照附录三。
由附录三的显著性检验可得:
葡萄酒的单宁、总酚、酒总黄酮、白藜芦醇、DPPH抑制体积都与酿酒葡萄的DPPH自由基、总酚、葡萄总黄酮、蛋白质呈显著的正相关。
葡萄酒的色泽L*与酿酒葡萄的DPPH自由基、总酚、葡萄总黄酮呈显著的负相关,与果皮颜色a*呈正相关。
其他指标间无显著性关系。
5.3.2酿酒葡萄与白葡萄酒的理化指标的关系
同理在第二问中,我们知道酿酒白葡萄的酒石酸、总糖、可溶性固形物、果穗质量、果皮颜色b*与白酒质量显著性相关,求出白葡萄酒的理化指标与白葡萄酒的质量分数的相关系数,如表4.3.2。
选出相对相关系数较高的五个指标,分别为:
酒总黄酮(mmol/L)、白藜芦醇(mg/L)、DPPH半抑制体积(IV50)1/IV50(uL)、L*(D65)、b*(D65)。
表4.3.2白葡萄酒的理化指标与白酒质量的相关系数
用上述葡萄酒的五个理化指标与第二问求得的酿酒葡萄的五个理化指标做相关分析,参照附录四。
由附录四的显著性检验得:
白葡萄酒的白藜芦醇与酿酒葡萄的总糖呈负相关。
白葡萄酒的色泽L*与酿酒葡萄的总糖、可溶性固形物呈显著的负相关,与果穗质量呈显著的正相关。
白葡萄酒的色泽b*与酿酒葡萄的总糖、可溶性固形物呈显著的正相关,与果穗质量呈显著的负相关。
其他理化指标间无显著性关系。
(四)问题四的解决
问题:
分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
5.4.1酿酒葡萄/红葡萄酒的显著性相关变量和红葡萄酒的的关系
根据二、三问的数据,得到酿酒葡萄和葡萄酒理化指标显著性较高的几组数据,分别与葡萄酒的质量建立多元回归方程。
分析—回归—线性,结果如下:
表4.4.1红酒的质量分数和酿酒葡萄的理化指标的回归。
。
说明模型的拟合效果较好。
P=0.6480.4540.7130.3190.791>0.05.说明酿酒葡萄的理化指标DPPH自由基、总酚、蛋白质、果皮颜色对葡萄酒质量的影响不明显。
p=0.012<0.05。
说明葡萄总黄酮、PH值对葡萄酒的质量有明显影响。
表4.4.2红葡萄酒的质量与红葡萄酒的理化指标的回归。
.说明模型的拟合效果一般。
P=0.340.2350.2990.0620.9530.480>0.05.说明红葡萄酒的理化指标对葡萄酒的质量影响不明显。
5.4.2酿酒葡萄/白葡萄酒的显著性相关变量和白葡萄酒的的关系
表4.4.3白葡萄酒的质量分数与酿酒葡萄的理化指标间的回归。
。
说明模型的拟合效果一般。
P=0.2070.5980.8370.4840.062>0.05.所以酿酒葡萄的理化指标对葡萄酒的质量没有明显影响。
表4.4.4白葡萄酒的质量分数与白葡萄酒的理化指标间的回归
。
说明模型的拟合效果较差。
P=0.2060.5730.2290.8590.916>0.05.所以白葡萄酒的理化指标对白酒质量没有明显的影响。
5.4.3证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量
按照给葡萄酒的评分制得出一下饼图
由上图可得:
香气分析占葡萄酒质量分数的30%,查阅资料得:
附件三的芳香物质的含量越多,酿出来的葡萄酒的香气越浓,香气的分数越高。
利用SPSS对红葡萄酒的芳香物质的各指标和葡萄酒质量做相关分析,结果见附录五:
得红葡萄酒的柠檬烯、乙酸辛酯、(Z)-3,7-二甲基-2,6-辛二烯醛、(E)-3,7-二甲基-2,6-辛二烯-1-醇对红酒质量有显著性影响。
同理得红葡萄的芳香物质的各指标和葡萄酒质量的相关分析表,见附录六。
得红葡萄的芳香物质中的乙醛、乙酸甲酯、乙酸乙酯、3-甲基丁醛、乙醇、丙酸乙酯、2-戊酮三氯甲烷、甲苯、乙醛、3-甲基-1-丁醇-乙酸酯、邻二甲苯、乙酸戊酯、柠檬烯、3-甲基-1-丁醇、(E)-2-已烯醛、2-苯乙基乙酸酯、(R)-3,7-二甲基-6-辛烯醇、3,7-二甲基-2,6-辛二烯酸甲酯、1-壬醇、(E,Z)-2,6-壬二烯醛、反式-2-壬烯酸、c&t苯乙醛这些指标对葡萄酒的质量有显著性影响。
白葡萄酒的各芳香物质与葡萄酒质量的相关分析表,见附录七。
得正十一烷、3-甲基-1-丁醇-乙酸酯、3-甲基-1-丁醇、乙酸庚酯、香叶基乙醚与白葡萄酒的质量有明显的正相关关系。
白葡萄的各芳香物质和葡萄酒质量的相关分析表,见附录八。
得(E)-2-已烯醛、乙酸乙酯、3-甲基-1-丁醇-乙酸酯与葡萄酒的质量有明显的相关性。
通过以上分析,发现无论是酿酒葡萄还是葡萄酒的芳香物质,都对葡萄酒的质量有一定的影响。
第三问中研究了酿酒葡萄、葡萄酒的理化指标对葡萄酒质量的影响,因此,在对葡萄酒的质量进行评价时,我们不能简单的只用酿酒葡萄和葡萄酒的理化指标来进行评价,还要把酿酒葡萄和葡萄酒的芳香物质也考虑进去。
六、模型的优缺点
6.1模型的优点
1、在对数据进行处理以及模型建立过程中,我们主要运用SPSS、EXCEL软件,使得模型建立求解相对方便,而且计算结果更加准确可信。
2、由于红葡萄与白葡萄,红葡萄酒与白葡萄酒差异有着不同的理化指标,因此利用相同的方法分别考虑,对所得结果综合考虑,增强了结论的说服力。
3、在对酿酒葡萄进行分级的过程中,我们用SPSS将多项指标进行相关分析,筛选出有显著性影响的少数指标,然后对其进行排序,分级,它在应用上侧重于信息贡献影响力综合评价,使所得的结果尽可能的准确。
4、利用SPSS软件的相关分析分析酿酒葡萄与葡萄酒理化指标之间的关系时,首先分别将两者的理化指标与葡萄酒的质量评分进行相关分析,筛选出显著性相关的指标,在对二者筛选出的指标进行相关分析,从而得出它们的联系。
这样既体现了模型的精确度,同时还能论证第二问的结果。
5、根据第四问所建的模型可以分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,不仅适用于此题中论证能够用葡萄和葡萄酒的理化指标来对葡萄酒样品的质量进行排序,在实际问题中具有简单的可操作性。
在没有评酒员的情况下依然可以根据样品葡萄的理化指标预测葡萄酒的质量,得到与实际情况较为符合的结果。
6.2模型的缺点
1、每一种统计分析方法都有它特地的假设、条件和数据要求,例如t检验等。
因此在应用多元分析方法时,应在研究计划阶段确定理论框架,这里在进行问题的分析时,先对数据做了预处理,对其中的错误、遗漏等样本进行了处理。
2、在进行后面问题的分析时,我们没有去考虑在酿酒过程中的化学物质的相互转变,由于各方面的局限性,难以从整体描述。
3、在进行相关性分析时,有些指标无法得到明确的分配,也影响了模型的精确性。
七、模型的推广
所建模型使用的统计分析方法在经济、社会等领域应用较为广泛,我们所建立的数学模型可以推广应用到类似问题的解决中,根据所得结论做出相应决策发挥重要的知道作用。
例如第四问得出的模型,我们可以用它来测定酿酒葡萄的特定的几个理化指标,就能将葡萄进行分类,这在现实的运用中有很大的潜力,可以帮助酿酒厂选着好的葡萄,以便酿酒厂酿造出更好的葡萄酒。
同样,这个模型也可以通过测定萄酒的特定的几个理化指标能直接给出葡萄酒的质量的一个排名,有利于分辨葡萄酒的质量好坏,更加方便品酒师和葡萄酒爱好者选酒。
八、参考文献
(1)王学民编著,应用多元分析,第四版,上海财经大学出版社。
(2)何晓群,刘文卿编著,应用回归分析,第三版,中国人民大学出版社。
(3)曾五一,肖红叶编著,统计学导论,第二版,科学出版社。
(4)庄军,蒋敏杰,李秀霞等编著,EXCEL统计分析与应用,修订版,电子科学出版社。
欢迎下载,资料仅供参考!
!
!