主成分分析在SPSS中的操作应用Word格式文档下载.doc

上传人:wj 文档编号:1511558 上传时间:2023-04-30 格式:DOC 页数:7 大小:145KB
下载 相关 举报
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第1页
第1页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第2页
第2页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第3页
第3页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第4页
第4页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第5页
第5页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第6页
第6页 / 共7页
主成分分析在SPSS中的操作应用Word格式文档下载.doc_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

主成分分析在SPSS中的操作应用Word格式文档下载.doc

《主成分分析在SPSS中的操作应用Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《主成分分析在SPSS中的操作应用Word格式文档下载.doc(7页珍藏版)》请在冰点文库上搜索。

主成分分析在SPSS中的操作应用Word格式文档下载.doc

m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0。

进行主成分分析主要步骤如下:

1. 

指标数据标准化(SPSS软件自动执行);

2. 

指标之间的相关性判定;

3. 

确定主成分个数m;

4. 

主成分Fi表达式;

5. 

主成分Fi命名;

主成分与综合主成分(评价)值。

三、对沿海10个省市经济综合指标进行主成分分析

(一)指标选取原则

  本文所选取的数据来自《中国统计年鉴2003》中2002年的统计数据,在沿海10省市经济状况主要指标体系中选取了10个指标:

X1——GDP 

X2——人均GDP

X3——农业增加值 

X4——工业增加值

X5——第三产业增加值 

X6——固定资产投资

X7——基本建设投资 

X8——国内生产总值占全国比重(%)

X9——海关出口总额 

X10——地方财政收入

图表1沿海10个省市经济数据

地区

GDP

人均GDP

农业增加值

工业增加值

第三产业增加值

固定资产投资

基本建设投资

社会消费品零售总额

海关出口总额

地方财政收入

辽宁

5458.2

13000

14883.3

1376.2

2258.4

1315.9

529

123.7

399.7

山东

10550

11643

1390

3502.5

3851

2288.7

1070.7

3181.9

211.1

610.2

河北

6076.6

9047

950.2

1406.7

2092.6

1161.6

597.1

1968.3

45.9

302.3

天津

2022.6

22068

83.9

822.8

960

703.7

361.9

941.4

115.7

171.8

江苏

10636

14397

1122.6

3536.3

3967.2

2320

1141.3

3215.8

384.7

643.7

上海

5408.8

40627

86.2

2196.2

2755.8

1970.2

779.3

2035.2

320.5

709

浙江

7670

16570

680

2356.5

3065

2296.6

1180.6

2877.5

294.2

566.9

福建

4682

13510

663

1047.1

1859

964.5

397.9

1663.3

173.7

272.9

广东

11770

15030

1023.9

4224.6

4793.6

3022.9

1275.5

5013.6

1843.7

1202

广西

2437.2

5062

591.4

367

995.7

542.2

352.7

1025.5

15.1

186.7

(二)主成分分析在SPSS中的具体操作步骤

  运用SPSS统计分析软件Factor过程[2]对沿海10个省市经济综合指标进行主成分分析。

具体操作步骤如下:

Analyzeà

DataReductionà

FactorAnalysis,弹出FactorAnalysis对话框

把X1~X10选入Variables框

Descriptives:

CorrelationMatrix框组中选中Coefficients,然后点击Continue,返回FactorAnalysis对话框

点击“OK”

图表2FactorAnalyze对话框与Descriptives子对话框

  SPSS在调用FactorAnalyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。

图表3相关系数矩阵

图表4方差分解主成分提取分析表

主成分分析在SPSS中的操作应用(下)

2005年11月30日9时47分 

图表5初始因子载荷矩阵

  从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。

可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。

  主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。

注:

特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。

通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;

人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。

所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。

但这两个新变量的表达还不能从输出窗口中直接得到,因为“ComponentMatrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。

  用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。

将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“Transformà

ComputeVariable”,在ComputeVariable对话框中输入“A1=B1/SQR(7.22)”[注:

第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。

同理,可得到特征向量A2。

将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:

因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]:

F1=0.353ZX1+0.042ZX2-0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZX10

F2=0.175ZX1-0.741ZX2+0.609ZX3-0.004ZX4+0.063ZX5-0.061ZX6-0.022ZX7+0.158ZX8-0.046ZX9-0.115ZX10

图表6ComputeVariable对话框

  前文提到SPSS会自动对数据进行标准化,但不会直接给出,需要我们自己另外算,我们可以通过Analyzeà

DescriptiveStatisticsà

Descriptives对话框来实现:

弹出Descriptives对话框后,把X1~X10选入Variables框,在Savestandardizedvaluesasvariables前的方框打上钩,点击“OK”,经标准化的数据会自动填入数据窗口中,并以Z开头命名。

图表7Descriptives对话框

  以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型:

  即可得到主成分综合模型:

F=0.327ZX1-0.072ZX2+0.054ZX3+0.310ZX4+0.323ZX5+0.304ZX6

+0.297ZX7+0.334ZX8+0.248ZX9+0.286ZX10

  根据主成分综合模型即可计算综合主成分值,并对其按综合主成分值进行排序,即可对各地区进行综合评价比较,结果见图表8。

图表8综合主成分值

城市

第一主成分F1

排名

第二主成分F2

综合主成分F

5.23

1

0.11

6

4.48

2.25

2

0.23

5

1.96

3

0.50

1.75

1.16

4

-0.19

8

0.96

上海

0.30

-2.36

10

-0.09

-1.24

-0.78

-1.35

7

0.41

-1.10

-1.97

-0.07

-1.70

-3.04

9

-1.01

-2.74

-3.29

-2.75

  对得出的综合主成分(评价)值,我们可用实际结果、经验与原始数据做聚类分析进行检验,对有争议的结果,可用原始数据做判别分析解决争议,具体评价与检验本文不做论述,如读者有兴趣可自行进行检验论述。

四、小结

  本文旨在阐述如何利用SPSS软件进行正确的主成分分析,使读者能正确使用SPSS进行主成分分析,以解决实际问题;

避免出现读者因子分析与主成分分析混用的情况,并希望今后的相关教科书能够说明清楚主成分分析在SPSS中的操作。

参考文献

[1]于秀林,任雪松.多元统计分析[M].北京:

中国统计出版社,1999.8.P154

[2]林海明,张文霖.主成分分析与因子分析详细的异同和SPSS软件[J].统计研究2005(3).

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2