1、主成份数据分析报告Spss和R语言1、实验题目 主成份分析实验二、实验目的通过本次实验对数据的处理,掌握主成份分析的原理,熟悉主成份分析在SPSS软件和R语言中的实现。三、实验原理四、实验数据如下给出中国近年国民经济主要指标统计,用主成分分析法对这些指标提取主成份,写出提取的主成份与这些指标之间的表达式。原始数据如下:年份全国人口农林牧渔业总产值工业总产值国内生产总值油料全社会投资总额棉花粮食199812481024516.7119048783452313.928406.2450.151230199912590924519.1126111820672601.229854.7389.250839
2、200012674324915.885673.789442295532917.744246218200112762726179.695449973152864.937213.5532.445264200212845327390.81107761051722897.243499.9491.645706200312922729691.8142271117390.228115566.648643069.5200422998836239201722135875.93065.970477.4632.446946.9200513075639450.9251619.5183084.83077.188773.
3、6571.448402.2四、SPSS实验步骤、定义变量、输入数据在菜单栏中选择“分析”“降维”“因子分析”。、除了“年份”选项都选入变量列表。、单击“描述”选中“原始分析结果”复选框“度”设为线性;选中“系数”单击“抽取”,选中“未旋转的因子解”复选框。其余默认 、选中“得分”“保存为变量”、选中“转换”“计算变量”,数字表达式中分别输入“a9=b9/SQR(3.849)”“a10=b10/SQR(1.808)”,由载荷矩阵得到主成份特征向量矩阵(a9 a10),(变量视图中改变增加的变量b9、b10、a9、a10的小数位数为3)五、SPSS实验结果与分析1、运行结果图如下所示: 2、sps
4、s结果分析:由成分矩阵可以得到各个变量的线性组合表达的主成份:F1=0.322*全国人口+0.448*农林牧渔业总产值+0.497*工业总产值+0.475*国内生产总值+0.392*油料+0.432*全社会投资总额+0.458*棉花-0.093*粮食;F2=-0.021*全国人口+0.267*农林牧渔业总产值+0.062*工业总产值+0.027*国内生产总值-0.368*油料+0.261*全社会投资总额-0.126*棉花+0.719*粮食。在第一主成份中,除了粮食以外的变量的系数比较大,可以看成反映那些变量的综合指标;在第二主成份中,变量粮食的系数比较大,可以看成反映粮食的综合指标。主成分分析
5、是一种矩阵变换,各个主成分并不一定有实际意义,本题目中的主成份含义不明确。由系数相关矩阵,各个变量之间都有一定的相关关系,一些相关系数接近于1,适合用主成分分析。方差贡献率和累计贡献率得出,前两个进行主成分分析,足够代替原来的变量,几乎涵盖了原变量所有的信息。成分矩阵给出了主成份与标准化形式的变量之间的表达式。数据窗口中,因子得分作为变量保存,六、R语言实验结果与分析输入命令:输出结果如下:主成分分析,求出x的相关系数矩阵第四步,求相关系数矩阵的特征值以及特征向量:特征值碎石图:结果分析:相关系数的特征值前两个都大于一,远大于其余的特征值,因此有第一主成分和第二主成份,F1=0.279*全国人口+0.430*农林牧渔业总产值+0.388*工业总产值+0.410*国内生产总值+0.339*油料+0.374*全社会投资总额+0.396*棉花-0.080*粮食;F2=-0.023*全国人口+0.069*农林牧渔业总产值+0.296*工业总产值+0.03*国内生产总值-0.409*油料+0.289*全社会投资总额-0.14*棉花+0.797*粮食。R语言程序运行结果与spss运行结果的比较同样第一主成分不包含粮食,第二主成份中粮食占主要影响,主成份表达式接近,误差很小。
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2