ImageVerifierCode 换一换
格式:DOCX , 页数:31 ,大小:202.08KB ,
资源ID:8762465      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-8762465.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(葡萄酒的评价模型.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

葡萄酒的评价模型.docx

1、葡萄酒的评价模型 葡萄酒的评价模型 摘要随着社会的进步,经济的发展,人们的知识水平的提高,葡萄酒越来越多的出现在人们的餐桌上。因此,葡萄酒的质量也受到了人们的重视,然而,目前葡萄酒的质量是由品酒员品评打分给出,由于主观性这必然会影响葡萄酒真实质量的确定。本题通过对一系列葡萄,葡萄酒的成分数据的分析,建立了葡萄酒的评价模型。对于问题一,我们除去几个错误数据以平均值代之处理,用EXCEL软件对数据进行一系列处理并进行进行方差分析可得两组品酒员的评价结果中第二组的评价结果更可信。用SPSS软件进行两独立样本T检验可知,两组品酒员对红葡萄酒的品评无显著性差异,对白葡萄的品评有显著性差异。对于问题二,我

2、们根据酿酒葡萄的一级指标并将葡萄酒的质量也作为一个指标对其进行系统聚类分析【1】,对红、白酿酒葡萄做出了分类,各分为五类。第三问中我们对酿酒葡萄与葡萄酒的公共理化指标用SPSS软件和MATLAB软件作多元回归分析和相关分析,建立了多个酿酒葡萄与葡萄酒的理化指标之间的多元线性回归模型,进而得出它们之间的相关性联系。第四问中我们运用主成分分析和多元线性回归分析,找出酿酒葡萄和葡萄酒的主要成分,然后建立酿酒葡萄和葡萄酒的主要成分与葡萄酒质量之间的多元线性回归模型,即红葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标之间的关系式:y=-0.0012-0.9764x1+0.2825x2+0.7103x3-0.4

3、800x4-0.3767x5+0.3023x6+0.3132x7-0.2246x8+0.5958x9+0.4415x10-0.3881x11+0.5550x12白葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标之间的关系式:y=0.0015+0.5648x1-0.3012x2-0.4185x3-1.4472x4+1.1306x5+0.1214x6+0.0843x7-0.0405x8+0.4541x9+0.0373x11+0.0060x12+0.4183x13-0.1754x14 .最后结合残差图对模型进行了拟合验证了所建模型是符合的。关键词 两独立样本T检验 聚类分析 相关分析 多元线性回归模型 主成

4、分分析 一、问题重述与分析1.1问题重述 随着社会的进步,经济的发展,人们的知识水平的提高,葡萄酒越来越多的出现在人们的餐桌上。因此,葡萄酒的质量也受到了人们的重视,然而,目前葡萄酒的质量是由品酒员品评打分给出,由于主观性这必然会影响葡萄酒真实质量的确定。因此基于酿酒葡萄的理化指标的研究而得出的葡萄酒的质量可信度更高。下面我们要解决四个问题:1. 分析两组评酒员的评价结果有无显著性差异并确定较可信的一组。 2根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的

5、理化指标来评价葡萄酒的质量。1.2问题分析 本题要建立的是葡萄酒的质量评价模型。首先,根据品酒员对葡萄酒质量的各个独立指标的打分,我们经过数据观察和处理,将几个错误数据去掉,代之以平均值处理,并将各个理化指标的数据单位进行了标准化处理,使之便于分析比较。 其次,对于问题一,用方差分析,方差波动较小的那组评价结果比较可信。再用两独立样本T检验的犯法分析两组评价结果是否有显著性差异。对于问题二,由第一问的结果选较可信那组综合评分作为葡萄酒的质量,联合酿酒葡萄的理化指标做系统聚类分析可对其进行分类。对于问题三,由生活常识可知,酿酒葡萄与葡萄酒理化指标之间必有某种相关性联系,因此我们用相关分析,并建立

6、多元线性回归模型,可得出它们的理化指标之间的联系。针对问题四,因为酿酒葡萄的理化指标太多,所以先用主成分分析找出酿酒葡萄和葡萄酒的主成分,再将质量与主成分进行多元回归分析,可得出它们之间的线性关系。 最后,模型检验,用MATLAB软件进行残差检验,观察拟合的程度。二、符号说明 符号意义取值范围Rij第一组品酒员i对红葡萄酒样品j的综合评分i=1,210,j=1,227rij第二组品酒员i对红葡萄酒样品j的综合评分i=1,210,j=1,227Wij第一组品酒员i对白葡萄酒样品j的综合评分i=1,210,j=1,228wij第二组品酒员i对白葡萄酒样品j的综合评分i=1,210,j=1,228A

7、j第一组红葡萄酒样品j的平均评分j=1,227aj第二组红葡萄酒样品j的平均评分j=1,227Bj第一组白葡萄酒样品j的平均评分j=1,228bj第二组白葡萄酒样品j的平均评分j=1,228S1j第一组红葡萄酒样品j的方差j=1,227S2j第二组红葡萄酒样品j的方差j=1,227S3j第一组白葡萄酒样品j的方差j=1,228S4j第二组白葡萄酒样品j的方差j=1,228 三、模型假设 1.错误数据剔除后可用平均值代之处理。 2.酒样品的各个评价指标是相互独立的。 3.酿酒葡萄及葡萄酒的各项指标均满足正态分布。 4.品酒员的评分结果比较独立、公正、客观、准确。 5.酿酒葡萄的二级指标对葡萄酒质

8、量影响极小。 四、模型建立与求解4.1问题一4.1.1问题的分析 问题一中要求我们确定哪组评价结果较可信,我们先观察数据并将错误数据剔除后以平均值代之。然后基于品酒员的专业水准的假设,我们想到分别求两组品酒员对各个酒样品关于各个指标评分的总和,再求十个总分的平均值,并求得方差,再分别画出它们的方差分布图,看哪组的分布比较稳定。独立样本T检验就是根据样本数据对两个样本来自的两独立总体的均值是否有显著差异进行推断,前提是两样本是相互独立的且数据满足正态分布。由假设,本题中的数据满足这两个条件。根据SPSS软件的操作结果分析可得出结论。4.1.2问题求解我们运用公式Aj=,aj=S2j=用EXCEL

9、软件求出各组葡萄酒的平均值和方差,如下表 表一第一组葡萄酒方差第二组葡萄酒方差酒样品S1jS3jS2jS4j188.01187.36877.56824.516237.695190.48412.30546.484343.411111.810529.095134.9894102.35842.35839.11639.884558.747119.78912.93724.895656.589154.14720.01121.526798.15837.10559.37939.958841.695111.810561.68429.484931.21187.88424.379100.641028.8201.48

10、434.27466.6951167.042167.836.04283.21275.463109.69523.8132.6741342.568161.77914.48444.3051434.105108.21121.93715.0421581.063124.67439.16851.21617.147168.63219.04277.9051783.379136.5898.68436.4321844.726148.30547.62128.6421944.88443.95852.25324.6742056.72161.01137.01147.41121109.989163.62133.64261.01

11、12247.958131.36822.98950.7792330.77941.35823.46310.9892470.947105.27410.15836.5162561.22132.09541.432100.8952629.64269.06339.36897.4842747.158136.819.42133.6842876.22124.042 表二第一组葡萄酒平均值第二组葡萄酒平均值酒样品AjBjajbj162.768.168.177.9280.3747475.8380.471.0274.675.6468.671.271.276.9573.372.172.181.5672.266.366.3

12、75.5771.565.365.374.2872.371.026672.3981.578.278.280.41074.268.868.879.81170.161.661.671.41253.968.368.372.41374.668.868.873.9147372.672.677.11558.765.765.778.41674.969.969.967.31779.374.574.580.3186365.465.476.71978.672.672.676.42072.977.875.876.62177.172.272.279.22277.271.671.679.42385.677.177.177

13、.4247871.571.576.12569.268.268.279.52673.8727274.3277271.571.57781.379.6注:红色标记的数据代表剔除错误数据后代之的平均值。 再作两组品酒员的评分方差图,如下图一 图二两组红葡萄酒方差分布图 两组白葡萄酒方差分布图 由图一、图二可看出第二组的方差比较稳定,因此第二组的评价结果更可信。各对两组白、红葡萄酒评分的均值用SPSS【2】软件进行两独立样本T检验,得到如下两表:方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限VAR00002假设方差相等

14、3.201.0791.46152.1502.327411.59293-.869045.52386假设方差不相等1.46140.326.1522.327411.59293-.891225.54603因为0.0790.05,所以方差相等的假设成立。再看第一行假设方差相等的情况,sig=0.1500.05,即说明p值大于显著性水平,即指两组品酒员对红葡萄酒的评价没有显著性差异。方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限VAR00004假设方差相等2.489.120-2.41154.019-2.585711.07

15、231-4.73557-.43586假设方差不相等-2.41147.330.020-2.585711.07231-4.74253-.42890因为0.1200.05,所以方差相等的假设成立。再看第一行假设方差相等的情况,sig=0.0190.05,即说明p值小于显著性水平,即指两组品酒员对白葡萄酒的评价有显著性差异。4.2问题二4.2.1问题的分析此问是让我们对酿酒葡萄进行分类,由此我们想到可以用聚类分析法解决此问题。聚类分析就是根据对象的某些属性将数据分组成为多个类,在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大,又被称为“无监督的分析方法”,意即没有因变量。聚类分析可从样本

16、数据出发自动进行分类。由于酿酒葡萄的理化指标比较多,因此我们只选一级指标,再结合第一问的结果将第二组的评分作为质量指标,用SPSS软件对其进行系统聚类分析,可分出若干类。注意在进行分析前要先将各数据进行标准化处理。4.2.2问题的求解 将酿酒葡萄的一级指标和质量指标数据导入SPSS软件,进行一系列操作,得到如下图三、图四;图三 群集成员案例6 群集5 群集4 群集3 群集1: 1.0011112: 2.0022213: 3.0033324: 4.0044435: 5.0044436: 6.0044437: 7.0044438: 8.0051119: 9.00222110: 10.0065431

17、1: 11.00444312: 12.00444313: 13.00444314: 14.00511115: 15.00444316: 16.00444317: 17.00444318: 18.00444319: 19.00444320: 20.00444321: 21.00333222: 22.00444323: 23.00222124: 24.00444325: 25.00654326: 26.00444327: 27.004443分五类第一类:1,8,14第二类:2,9,23第三类:3,21第四类:4,5,6,7,11,12,13,15,16,17,18,19,20,22,24,26,2

18、7第五类:10,25图四群集成员案例6 群集5 群集4 群集3 群集1: 1.0011112: 2.0022213: 3.0032214: 4.0022215: 5.0022216: 6.0043117: 7.0043118: 8.0054329: 9.00222110: 10.00222111: 11.00543212: 12.00222113: 13.00111114: 14.00222115: 15.00431116: 16.00543217: 17.00222118: 18.00431119: 19.00222120: 20.00222121: 21.00222122: 22.0022

19、2123: 23.00222124: 24.00222125: 25.00222126: 26.00222127: 27.00654328: 28.002221分五类第一类:1,13第二类:2,3,4,5,9,10,12,14,17,19,20,21,22,23,24,25,26,28第三类:6,7,15,18第四类:8,11,16第五类:274.3问题三4.3.1问题的分析 为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们选取各项指标的相关系数作为关联程度的指标。对于相关系数较大的各项指标整理出来,再对它们进行多元线性回归分析【3】,得到的多元线性方程就是它们之间的联系。在大多数的实际问题

20、中,影响因变量的因素不是单个而是多个,我们称这类问题为多元回归分析。事实上,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效更符合实际。可以建立因变量Y与各自变量Xj(j=1,2n)之间的多元线性回归模型:Y=b0+b1X1+b2X2+bnXn+e,其中b0是回归常数,bk为回归系数,e是随机误差。第三问便可以使用这一模型解决,用表达式直观地说明酿酒葡萄与葡萄酒理化指标之间的联系。先考虑酿酒葡萄与葡萄酒的公共理化指标之间的联系,建立多元线性回归模型。相关分析是分析客观事物之间关系的定量分析方法,许多事物或现象之间总是相互关联的,并且可以通过一定的数量关系反映出

21、来。4.3.2问题的求解由附表二可知酿酒红葡萄与葡萄酒的公共理化指标【3】有五个,分别是花色苷、单宁、总酚、酒总黄酮、白藜芦醇。酿酒白葡萄与葡萄酒的公共理化指标有四个,分别是单宁、总酚、酒总黄酮。先分析红葡萄。用x1,x2,x3,x4,x5分别表示花色苷、单宁、总酚、酒总黄酮、白藜芦醇。用MATLAB软件实现,程序见附录1、2、3、4、5.先看红葡萄酒。1)、红葡萄酒花色苷与x1、x2、x3、x4、x5的关系:Y=0.9393x1+0.1645x2-0.0544x3-0.1559x4+0.0319x5,红葡萄酒中花色苷与酿酒葡萄的花色苷有较大的正相关性。2)、红葡萄酒单宁与x1、x2、x3、x

22、4、x5的关系:Y=0.1836x1+0.1890x2+0.7138x3-0.0911x4+0.0873x5红葡萄酒中单宁与酿酒葡萄的总酚有较大的正相关性。3)、红葡萄酒总酚与x1、x2、x3、x4、x5的关系:Y=0.3241x1+0.0877x2+0.3290x3+0.2749x4+0.1006x5红葡萄酒中总酚与酿酒葡萄的五指标无明显的正相关性。4)、红葡萄酒酒总黄醇与x1、x2、x3、x4、x5的关系:Y=0.1812x1+0.0205x2+0.5342x3+0.2266x4+0.0644x5红葡萄酒中酒总黄醇与酿酒葡萄的总酚有较大的正相关性。5)、红葡萄酒白藜芦醇与x1、x2、x3、

23、x4、x5的关系:Y=-0.1388x1+0.0524x2-0.0531x3+0.7292x4-0.0138x5红葡萄酒中白藜芦醇与酿酒葡萄的葡萄总黄醇有较大的正相关性。运用相关分析,如下图所示红葡萄酒主要指标相关系数矩阵酿红花色苷酿红单宁酿红总酚葡萄总黄醇酿红白藜芦醇花色苷单宁总酚酒总黄醇白藜芦醇酿红花色苷1.000.688.728.566-.060.923.720.774.709.200酿红单宁.6881.000.755.688-.050.661.718.743.701.315酿红总酚.728.7551.000.895-.019.613.817.875.883.459葡萄总黄醇.566.6

24、88.8951.000.021.441.684.815.823.567酿红白藜芦醇-.060-.050-.019.0211.000-.035.049.076.047.014花色苷.923.661.613.441-.0351.000.744.765.665.124单宁.720.718.817.684.049.7441.000.921.837.331总酚.774.743.875.815.076.765.9211.000.904.486酒总黄醇.709.701.883.823.047.665.837.9041.000.399白藜芦醇.200.315.459.567.014.124.331.486.3

25、991.000由此图可知,红葡萄酒中的花色苷与酿酒葡萄中的花色苷、单宁有较大的正相关性。红葡萄酒中的单宁与酿酒葡萄的花色苷、总酚有较大的正相关性。红葡萄酒中的总酚与酿酒葡萄的总酚、葡萄总黄醇有较大的正相关性。红葡萄酒中的酒总黄醇与酿酒葡萄的总酚、葡萄总黄醇有较大的正相关性。红葡萄酒中的白藜芦醇与酿酒葡萄的总酚、葡萄总黄醇有较大的正相关性。综合起来前面MATLAB的结果,红葡萄酒中的花色苷与酿酒葡萄的花色苷有较大的正相关性。红葡萄酒中的单宁与酿酒葡萄中的总酚有较大的正相关性。红葡萄酒中的总酚与酿酒葡萄的总酚、葡萄棕黄醇有较大的正相关性。红葡萄酒中的酒总黄醇与酿酒葡萄的总酚有较大的正相关性。红葡萄

26、酒中的白藜芦醇与酿酒葡萄的葡萄总黄醇有较大的正相关性。再用x1,x2,x3,x4分别表示酿酒白葡萄中的单宁、总酚、葡萄总黄醇、白藜芦醇。用MATLAB软件实现,程序见附录6,7,8,9。1)、白葡萄酒中单宁与x1、x2、x3、x4的关系: Y=0.4234x1-0.3364x2+0.5838x3-0.0569x4白葡萄酒中单宁与酿酒葡萄的葡萄总黄醇有较大的正相关性。2)、白葡萄酒中总酚与x1、x2、x3、x4的关系: Y=0.3619x1-0.0577x2+0.4419x3+0.0320x4白葡萄酒中总酚与酿酒葡萄的葡萄总黄醇有一定的正相关性。3)、白葡萄酒中酒总黄醇与x1、x2、x3、x4的关系: Y=-0.0665x1+0.7742x2+0.

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2