基于主成分聚类分析法对果蔬营养成分的实证研究doc.docx
《基于主成分聚类分析法对果蔬营养成分的实证研究doc.docx》由会员分享,可在线阅读,更多相关《基于主成分聚类分析法对果蔬营养成分的实证研究doc.docx(12页珍藏版)》请在冰点文库上搜索。
基于主成分聚类分析法对果蔬营养成分的实证研究doc
基于主成分聚类分析法对果蔬营养成分的实证研究
一、研究背景及意义
营养、健康、食品安全是21世纪人类社会关注的焦点问题。
粮食作物为全世界基本的食品安全(foodsecurity)提供了能量保障,合理的饮食不仅有益于健康,而且可以预防一些疾病的发生,从而提高人们的生活质量。
而水果和蔬菜中丰富的营养和生物活性物质则为人类的营养和健康安全(foodsafety)提供了根本物质保证。
随着人们营养和保健意识的提高,果蔬产品中营养和生物活性物质的价值也越来越为人们所重视。
据相关资料显示,人体需要的营养素主要有蛋白质、脂肪、维生素、矿物质、糖和水。
其中维生素对于维持人体新陈代谢的生理功能是不可或缺的,多达30余种,分为脂溶性维生素(如维生素A、D、E、K等)和水溶性维生素(如维生素B1、B2、B6、B12、C等)。
矿物质无机盐等亦是构成人体的重要成分,约占人体体重的5%,主要有钙、钾、硫等以及微量元素铁、锌等。
另外适量地补充膳食纤维对促进良好的消化和排泄固体废物有着举足轻重的作用。
水果和蔬菜是重要的农产品,主要为人体提供矿物质、维生素、膳食纤维。
近年来,中国水果和蔬菜种植面积和产量迅速增长,水果和蔬菜品种也日益丰富,中国居民生活水平不断提高,人们对人体营养均衡的意识也有所增强。
然而多数中国居民喜食、饱食、偏食、忽视人体健康所需的营养均衡的传统饮食习惯尚未根本扭转,这就使得我国的果蔬消费(品种和数量)在满足居民身体健康所需均衡营养的意义下,近乎盲目无序,进而影响到果蔬生产。
因此,分析我国生活中常见果蔬的营养成分,科学地调整饮食习惯,继而规划我国果蔬的中长期的种植模式,具有重要的战略意义。
食物中可给人体提供能量、构成机体和组织修复以及具有生理调节功能的化学成分——营养素对人体非常重要。
因此在满足营养均衡的情况下,依据营养成分将水果蔬菜分类是有意义的。
现代医学研究表明,人体所需的营养素不下百种,其中一些可由自身合成、制造,但无法自身合成、制造必须有外界摄取的约有40余种,精细分后,可概括七大营养素:
蛋白质、脂类、糖类、维生素、水、无机盐(矿物质)、以及膳食纤维。
二、教学目的:
通过本案例的教学,使学生:
1.理解相关分析的涵义;
2.掌握相关分析的定量计算方法;
3.理解相关分析的经济涵义;
4.会根据实际资料计算相应的相关系数、建立回归方程、因素分析;
5.会根据实际计算相应的对所研究的问题做相应的分析。
三、教学难点
1.会根据实际资料计算相应的相关系数、建立回归方程、因素分析;
2.会根据实际计算相应的对所研究的问题做相应的分析。
三、数据说明及研究方法
(一)数据说明
本案例中数据来自中国食物成分表2012》,从中我们选择了人们生活中常见的25种蔬菜和26种水果分别探究其营养成分的分布情况。
25种蔬菜名称:
胡萝卜萝卜竹笋大白菜菠菜菜花韭菜芹菜生菜蒜苗小白菜油菜圆白菜冬瓜西红柿青椒茄子黄瓜苦瓜南瓜丝瓜土豆蘑菇目耳香菇
26种蔬菜名称:
苹果梨桃子杏子李子葡萄香蕉草莓橙子橘子柚子西瓜哈密瓜桑葚柿子大枣荔枝龙眼芒果猕猴桃菠萝山楂椰子柠檬木瓜枇杷
(二)研究方法
简单的描述性统计方法是对统计数据进行整理和描述的方法,常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等,还可以直接从数据本身入手寻找最值,均值中位数等来研究事物的本质特征。
常用的软件如Excel、Spss等都可以实现这一过程。
图1常见蔬菜能量含量条形图
如图1、图2通过比较各种蔬菜的能量、蛋白质、脂肪、胆固醇、碳水化合物的含量分布,可以发现所有蔬菜胆固醇含量均为0,蘑菇、木耳、香菇这三种蔬菜相应的营养物质含量相比其他较多。
图2常见蔬菜蛋白质、脂肪、胆固醇、膳食纤维、碳水化合物含量条形图
图3常见蔬菜维生素含量条形图
通过比较各种蔬菜的维生素的含量分布,可以发现胡萝卜、菠菜、生菜中所含的维生素A比较多,蒜苗、木耳、香菇所含的维生素B1较多,苦瓜、菜花、青椒维生素C含量较多,蘑菇,木耳,茄子维生素E含量较多。
图4常见蔬菜矿物质含量条形图
通过比较各种蔬菜矿物质的含量分布,可以发现大白菜、菠菜的钠含量较高,油菜、蘑菇、木耳钙含量较高,蘑菇、木耳、香菇这三种蔬菜的铁、辛、硒含量相比其他较多。
用同样的方法我们可以得到常见水果的营养素分布情况。
2.主成分分析法
由于给出的食物中营养成分的种类繁多,我们在研究中首先利用主成分的分析方法将众多营养成分降维综合成少数几个主要因子,再依据这几个因子对水果和蔬菜的品种分类。
本案例利用中国食物成分表中给出了多种种蔬菜和水果的营养成分列表,重新整理数据信息。
鉴于数据分析的科学性要求,先将未检出和微量成分的数据令其值为0,再将数据全部缺失的营养成分指标删除,最后将缺失部分数据的食物纪录删除。
这样最终汇总出人们生活中常见的26种水果和25蔬菜营养成分的数据集,相应的数据特征见表1。
表1营养成分基本特征表
N
极小值
极大值
均值
标准差
蛋白质
52
.2
21.0
2.117
4.0695
脂肪
52
.1
12.1
.598
1.7553
膳食纤维
52
.2
31.6
2.794
6.3393
碳水化合物
52
1.3
35.7
10.385
8.9689
维生素A
52
0
688
75.15
130.98
维生素C
52
0
243
26.63
35.441
维生素E
52
.00
11.34
1.3256
2.2902
钠
52
.4
89.3
17.384
25.476
钙
52
0
247
35.71
45.428
铁
52
.0
97.0
3.025
13.438
锌
52
.07
8.57
.6469
1.4655
硒
52
.0
39.2
1.656
5.4406
有效的列表状态
52
表2营养成分相关系数表
蛋白质
脂肪
膳食纤维
碳水化合物
维生素A
维生素C
维生素E
钠
钙
铁
锌
硒
(蛋白质)
1.000
.371
.921
.579
.095
-.153
.399
.125
.565
.474
.964
.763
(脂肪)
.371
1.000
.293
.492
-.014
-.110
.110
.221
.111
.119
.300
.313
(膳食纤维)
.921
.293
1.000
.652
-.012
-.151
.548
.104
.643
.709
.906
.545
碳水化合物)
.579
.492
.652
1.000
-.174
.188
.477
-.119
.249
.459
.592
.406
(维生素A)
.095
-.014
-.012
-.174
1.000
-.057
-.017
.496
.157
-.035
.057
.207
(维生素C)
-.153
-.110
-.151
.188
-.057
1.000
-.095
-.037
-.106
-.118
-.041
-.111
(维生素E)
.399
.110
.548
.477
-.017
-.095
1.000
.101
.561
.637
.307
.408
(钠)
.125
.221
.104
-.119
.496
-.037
.101
1.000
.405
.187
.074
.039
(钙)
.565
.111
.643
.249
.157
-.106
.561
.405
1.000
.717
.486
.375
(铁)
.474
.119
.709
.459
-.035
-.118
.637
.187
.717
1.000
.380
.160
(锌)
.964
.300
.906
.592
.057
-.041
.307
.074
.486
.380
1.000
.664
(硒)
.763
.313
.545
.406
.207
-.111
.408
.039
.375
.160
.664
1.000
由于营养成分表中的分类指标较多,且通过表2营养成分的相关系数矩阵表可以看出有些成分间具有强相关性。
因此为了简化问题我们采用主成分分析法的降维思想,将常见果蔬营养成分汇总表中的12种营养素综合成较少量的指标。
利用SPSS18.0,首先对51种常见果蔬的营养成分数据标准化,再做主成分分析。
表3特征值和相应的累计贡献率
初始特征值
提取平方和载入
旋转平方和载入
成份
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
5.159
42.994
42.994
5.159
42.994
42.994
3.556
29.634
29.634
2
1.713
14.274
57.267
1.713
14.274
57.267
2.987
24.890
54.523
3
1.382
11.515
68.782
1.382
11.515
68.782
1.657
13.811
68.334
4
1.070
8.916
77.698
1.070
8.916
77.698
1.124
9.364
77.698
5
0.965
8.045
85.743
6
0.671
5.589
91.332
7
0.452
3.768
95.100
8
0.286
2.382
97.483
9
0.151
1.256
98.738
10
0.139
1.157
99.895
11
0.009
0.072
99.967
通过表3特征值和相应的累计贡献率的信息可以看到:
第3主成分的累计贡献率为68.334,前4个主成分的累计贡献率就可达77.698%,说明前4的主成分就已经可以提取原指标大部分的信息,而且图1相应的碎石图结果也很好,所以这里我们提取4个主成分来代替原来的12个指标。
图5碎石图
表4反应了方差最大法做因子旋转后的成分矩阵,可以看到相应主成分的意义比较明显。
第一主成分主要代表了果蔬中的蛋白质、脂肪、膳食纤维、碳水化合物、锌、硒;第二主成分代表了维生素E、钙、铁;第三主成分代表了维生素A和纳;第四主成分主要代表了维生素C。
表4因子旋转成分矩阵
成分
1
2
3
4
蛋白质
.877
.391
.053
-.149
脂肪
.602
-.058
.114
.191
膳食纤维
.704
.644
-.052
-.091
碳水化合物
.651
.375
-.288
.418
维生素A
.096
-.087
.831
-.103
维生素C
-.061
-.076
-.008
.906
维生素E
.191
.782
-.046
.002
钠
.008
.214
.865
.081
钙
.235
.800
.321
-.095
铁
.134
.919
.001
.004
锌
.866
.322
.000
-.057
因子得分系数和原始变量的标准化值可以计算每个观测值的各主成分的的得分数,并可以以此对观测量进行进一步的分析。
相应的得分系数矩阵参见表5,对应的主成分得分表达式如下:
表5成分得分系数矩阵
成份
1
2
3
4
Zscore(蛋白质)
.262
-.036
.003
-.116
Zscore(脂肪)
.265
-.182
.091
.184
Zscore(膳食纤维)
.126
.140
-.067
-.066
Zscore(碳水化合物)
.174
.045
-.155
.366
Zscore(维生素A)
.062
-.106
.509
-.020
Zscore(维生素C)
-.003
.005
.081
.819
Zscore(维生素E)
-.120
.342
-.062
.021
Zscore(钠)
-.050
.070
.533
.159
Zscore(钙)
-.107
.321
.156
-.032
Zscore(铁)
-.179
.422
-.038
.031
Zscore(锌)
.276
-.063
-.018
-.040
Zscore(硒)
.296
-.151
.049
-.145
提取方法:
主成分分析法。
旋转法:
具有Kaiser标准化的正交旋转法。
3.聚类分析法
基于上述的主成分分析的结果,利用SPSS得到相应的因子得分矩阵,从中选出主要的因子得分项并依此进行系统聚类分析。
这样不仅剔除了传统聚类分析中指标的重叠性,提高了聚类分析的精度,而且综合了因子得分的信息,使得分析更加全面、客观。
通过分析得到常见果蔬的6种分类,具体结果如下:
第一类:
竹笋、菜花、蒜苗、圆白菜、冬瓜、西红柿、辣椒、茄子、黄瓜、苦瓜、南瓜、丝瓜、土豆、榨菜、苹果、梨、红果、桃子、李子、杏子、西瓜、菠萝、桂圆、荔枝、芒果、香蕉、枇杷、橙子、橘子、柚子、柠檬、葡萄、柿子、桑葚、猕猴桃、草莓
第二类:
胡萝卜、萝卜、大白菜、菠菜、韭菜、芹菜、生菜、小白菜、油菜、哈密瓜
第三类:
蘑菇、香菇
第四类:
大枣
第五类:
木耳
最后综合这些果蔬相应的产量,同时比对它们的营养素含量可以找出最终的水果、蔬菜分类:
蔬菜类:
胡萝卜、萝卜、大白菜、菠菜、油菜、蘑菇、香菇、木耳、西红柿、青椒、黄瓜
水果类:
苹果、桃子、梨、葡萄、香蕉、芒果、大枣
图2系统聚类法树状图
四、研究结论和建议
在每天饮食中,盲目吃饱了肚子并不等于吃进了人体所需要的各种营养成分。
有的营养成分可能吃多了,而有的营养成分可能还没吃到。
人体所需的营养成分缺乏和过剩同时出现在同一人身上的状态便是营养失衡。
营养成分的缺乏会导致某些内分泌不足而引起生理功能紊乱,进而产生各种各样的疾病。
而营养成分过剩不只是资源的浪费,它和营养成分缺乏一样也会导致一系列病症。
理想的目标是膳食所提供的各种营养成分和人体的需求恰好一致,亦即营养平衡。
因此,营养平衡对于人们的健康生活是至关重要的。
然而要真正做到严格意义的营养平衡却是极其困难的事。
实践得知,没有任何一种天然食物能包含人体所需要的各类营养成分。
不同的蔬菜、水果尽管各种营养素含量各不相同,但营养素的种类大致相近,存在着食用功能的相似性。
如本例中胡萝卜、萝卜、大白菜、菠菜、韭菜、芹菜、生菜、小白菜、油菜、哈密瓜所含的营养成分比较相近,这时可以考虑用其中的果蔬进行替代。
另外,如木耳大枣所含的营养成分可能比较特殊,其他一些果蔬所含比较欠缺,我们可以考虑对木耳大枣的摄入。
综上所述,水果与水果之间、蔬菜与蔬菜之间、水果与蔬菜之间从营养学角度在一定程度上可以相互替代、相互补充的,进而使得居民在满足每日营养需要前提下有最少的消费购买支出。