主成份数据分析报告Spss和R语言.docx

上传人:b****8 文档编号:9407722 上传时间:2023-05-18 格式:DOCX 页数:11 大小:684.80KB
下载 相关 举报
主成份数据分析报告Spss和R语言.docx_第1页
第1页 / 共11页
主成份数据分析报告Spss和R语言.docx_第2页
第2页 / 共11页
主成份数据分析报告Spss和R语言.docx_第3页
第3页 / 共11页
主成份数据分析报告Spss和R语言.docx_第4页
第4页 / 共11页
主成份数据分析报告Spss和R语言.docx_第5页
第5页 / 共11页
主成份数据分析报告Spss和R语言.docx_第6页
第6页 / 共11页
主成份数据分析报告Spss和R语言.docx_第7页
第7页 / 共11页
主成份数据分析报告Spss和R语言.docx_第8页
第8页 / 共11页
主成份数据分析报告Spss和R语言.docx_第9页
第9页 / 共11页
主成份数据分析报告Spss和R语言.docx_第10页
第10页 / 共11页
主成份数据分析报告Spss和R语言.docx_第11页
第11页 / 共11页
亲,该文档总共11页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

主成份数据分析报告Spss和R语言.docx

《主成份数据分析报告Spss和R语言.docx》由会员分享,可在线阅读,更多相关《主成份数据分析报告Spss和R语言.docx(11页珍藏版)》请在冰点文库上搜索。

主成份数据分析报告Spss和R语言.docx

主成份数据分析报告Spss和R语言

1、实验题目

主成份分析实验

二、实验目的

通过本次实验对数据的处理,掌握主成份分析的原理,熟悉主成份分析在SPSS软件和R语言中的实现。

三、实验原理

四、实验数据

如下给出中国近年国民经济主要指标统计,用主成分分析法对这些指标提取主成份,写出提取的主成份与这些指标之间的表达式。

原始数据如下:

年份

全国人口

农林牧渔业总产值

工业总产值

国内生产总值

油料

全社会投资总额

棉花

粮食

1998

124810

24516.7

119048

78345

2313.9

28406.2

450.1

51230

1999

125909

24519.1

126111

82067

2601.2

29854.7

389.2

50839

2000

126743

24915.8

85673.7

89442

2955

32917.7

442

46218

2001

127627

26179.6

95449

97315

2864.9

37213.5

532.4

45264

2002

128453

27390.8

110776

105172

2897.2

43499.9

491.6

45706

2003

129227

29691.8

142271

117390.2

2811

5566.6

486

43069.5

2004

229988

36239

201722

135875.9

3065.9

70477.4

632.4

46946.9

2005

130756

39450.9

251619.5

183084.8

3077.1

88773.6

571.4

48402.2

 

四、SPSS实验步骤

、定义变量

②、输入数据

③在菜单栏中选择“分析”→“降维”→“因子分析”。

④、除了“年份”选项都选入变量列表。

⑤、单击“描述”→选中“原始分析结果”复选框→“度”设为线性;选中“系数”

⑥单击“抽取”,选中“未旋转的因子解”复选框。

其余默认

⑦、选中“得分”→“保存为变量”

⑧、选中“转换”→“计算变量”,数字表达式中分别输入“a9=b9/SQR(3.849)”“a10=b10/SQR(1.808)”,由载荷矩阵得到主成份特征向量矩阵(a9a10),(变量视图中改变增加的变量b9、b10、a9、a10的小数位数为3)

五、SPSS实验结果与分析

1、运行结果图如下所示:

2、spss结果分析:

由成分矩阵可以得到各个变量的线性组合表达的主成份:

F1=0.322*全国人口+0.448*农林牧渔业总产值+0.497*工业总产值+0.475*国内生产总值+0.392*油料+0.432*全社会投资总额+0.458*棉花-0.093*粮食;

F2=-0.021*全国人口+0.267*农林牧渔业总产值+0.062*工业总产值+0.027*国内生产总值-0.368*油料+0.261*全社会投资总额-0.126*棉花+0.719*粮食。

在第一主成份中,除了粮食以外的变量的系数比较大,可以看成反映那些变量的综合指标;在第二主成份中,变量粮食的系数比较大,可以看成反映粮食的综合指标。

主成分分析是一种矩阵变换,各个主成分并不一定有实际意义,本题目中的主成份含义不明确。

由系数相关矩阵,各个变量之间都有一定的相关关系,一些相关系数接近于1,适合用主成分分析。

方差贡献率和累计贡献率得出,前两个进行主成分分析,足够代替原来的变量,几乎涵盖了原变量所有的信息。

成分矩阵给出了主成份与标准化形式的变量之间的表达式。

数据窗口中,因子得分作为变量保存,

六、R语言实验结果与分析

①输入命令:

②输出结果如下:

③主成分分析,求出x的相关系数矩阵

④第四步,求相关系数矩阵的特征值以及特征向量:

⑤特征值碎石图:

⑥结果分析:

相关系数的特征值前两个都大于一,远大于其余的特征值,因此有第一主成分和第二主成份,F1=0.279*全国人口+0.430*农林牧渔业总产值+0.388*工业总产值+0.410*国内生产总值+0.339*油料+0.374*全社会投资总额+0.396*棉花-0.080*粮食;

F2=-0.023*全国人口+0.069*农林牧渔业总产值+0.296*工业总产值+0.03*国内生产总值-0.409*油料+0.289*全社会投资总额-0.14*棉花+0.797*粮食。

⑦R语言程序运行结果与spss运行结果的比较

同样第一主成分不包含粮食,第二主成份中粮食占主要影响,主成份表达式接近,误差很小。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2