因子分析和主成分分析Word文档下载推荐.docx
《因子分析和主成分分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《因子分析和主成分分析Word文档下载推荐.docx(22页珍藏版)》请在冰点文库上搜索。
0。
54
28
9。
77
13。
74
4.78
8。
59
99
1.34
10。
02
7.5
10.16
2.13
6.22
14
52
84
2.17
2.73
1.09
7。
57
7.07
12。
79
2.10
0.82
03
7.08
2.59
11.76
4.54
5.51
98
30
6.92
5.33
40
27
62
44
36
7.63
8.84
8.39
8.74
01
31
11。
68
3.53
1.12
9.64
9.49
13
18.52
35
73
1.33
00
9.87
87
11.06
3.70
17
85
9.91
2.62
12
49
9.72
64
43
19
69
2.76
3.55
5.81
5.38
3.43
1.61
2.80
78
09
3.72
5.90
1.55
7.50
1.97
51
6
67
75
39
92
10.05
96
5.24
94
38
6.49
06
2.81
23
2.30
4.39
37
2.27
46
7.31
04
58
16.18
42
55
4.25
11.74
3.51
05
50
07
10
1.29
8.21
08
2.42
3.75
4.66
72
41
11
12.5
45
0.91
实验步骤:
1.建立数据文件.定义变量名:
分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,建立数据文件,保存为“生化检验”。
2.选择菜单“分析→降维→因子分析”,弹出“因子分析”对话框.在对话框左侧的变量列表中选变量X1至X7,进入“变量”框,如图1.
3.单击“描述"
按钮,弹出“因子分析:
描述统计”对话框,在“统计量”中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数”,计算相关系数矩阵,并选“KMO和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2。
图1
图2
4.单击“抽取”按钮,弹出“因子分析:
抽取”对话框,选用“主成分"
方法提取因子,如图3。
图3
5.单击“旋转”按钮,弹出“因子分析:
旋转"
对话框,在“方法"
栏中选择“最大方差"
进行因子正交旋转,如图4.
6.单击“得分”按钮,弹出“因子分析:
得分"
对话框,选择“回归"
项估计因子得分系数,如图5.
7.单击“确定”,得到输出结果。
图4
图5
实验结果
(1)考察原有变量是否适合进行因子分析
表1
表1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表2
由表1-2可知,巴特利特球度检验统计量观测值为326.191,相应的概率p值接近0,如果显著性水平α为0。
05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0。
321,根据Kaiser给出的KMO度量标准可知KMO值偏小,意味着因子分析的结果可能不能接受。
(2)提取因子
表3
表4
表3和表4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标.方差分解表也表明前两个因子能够解释7个指标的88.593%.综合以上,提取前两个因子最好了。
(3)因子的命名解释
表5
表6
由表5、表6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释。
因子1主要解释的是X1、X2、X4、X7,命名为FAC1_1;
而因子2主要解释的是其余三个指标,X3、X5、X6.命名为FAC2_1。
九、课外作业:
数据文件“development。
sav”是某年我国各省发展状况的一些指标,包括人均GDP、人力资源指数CAPITAL、人均收入INCOME、人均净收入NETINC、教育指数、健康指数,试用主成分法或者因子分析法寻找这些指标主要代表了发展状况的哪些特征,以及各省市的发展程度排序.
对某市15个大中型工业企业经济效益进行分析。
经研究,从有关经济效益指标中选择7个指标作分析,即:
固定资产产值率、固定资产利税率、资金利润率、资金利税率、流动资金周转天数、销售收入利税率和全员劳动生产率,数据文件为“某市工业企业效益指标.sav"
试研究该市大中型工业企业经济效益的状况及差异。
1、实验步骤:
1.打开数据文件“development。
sav”。
2.选择菜单“分析→降维→因子分析”,弹出“因子分析”对话框。
在对话框左侧的变量列表中选变量gdp,capital,income,netinc,education,healcare,进入“变量"
框,如图1—1。
3.单击“描述”按钮,弹出“因子分析:
描述统计”对话框,在“统计量”中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数"
计算相关系数矩阵,并选“KMO和Bartlett的球型度检验"
项,对相关系数矩阵进行统计学检验,如图1-2.
图1—1
图1-2
4.单击“抽取”按钮,弹出“因子分析:
抽取"
对话框,选用“主成分”方法提取因子,如图1—3。
图1—3
5.单击“旋转”按钮,弹出“因子分析:
旋转”对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图1—4。
得分”对话框,选择“回归”项估计因子得分系数,如图1-5.
7.单击“确定”钮,得到输出结果。
图1-4
图1—5
2、实验结果
表1—1
表1—1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表1-2
由表1-2可知,巴特利特球度检验统计量观测值为148.715,相应的概率p值接近0,如果显著性水平α为0。
05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0。
635,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。
表1-3
表1-4
表1—3和表1—4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这6个指标。
方差分解表也表明前两个因子能够解释6个指标的85.255%。
综合以上,提取前两个因子最好了.
表1—5
表1-6
由表1—5、表1—6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释。
因子1主要解释的是人均GDP、人均收入和人均净收入,可以命名为经济因子;
而因子2主要解释的是其余三个指标,人力资源指数、EDUCATION和健康指数。
可以命名为民生因子.因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关.可见,对因子进行旋转是完全有必要的。
(4)计算因子得分
表1—7
根据表1—7可写出以下因子得分函数:
F1=0。
362人均GDP+0。
038人力资源指数+0。
332人均收入+0.350人均净收入—0.030EDUCATION-0。
151健康指数
F2=—0.074人均GDP+0。
324人力资源指数-0。
059人均收入—0.025人均净收入+0.397EDUCATION+0。
445健康指数
(5)计算综合得分.单击“转换→计算变量"
新建输出变量,命名为“score分"
并输入其计算公式,如图1—6所示。
然后,新建一个变量“rank"
一次输入1到29
。
很清楚地可以对29个省进行评价。
图1—6
图1—7
综合以上分析,可以认为①指标人均GDP、人均收入、人均净收入代表了发展状况中的经济特征,而指标人力资源指数、健康指数、教育则代表了发展状况中的民生特征。
②各省市的排序如图1—7所示,即为上海〉北京〉广东〉江苏〉浙江〉辽宁>
天津〉山东〉四川〉河北>
福建>
湖北〉湖南〉黑龙江>
河南〉广西>
安徽>
吉林>
海南〉云南>
新疆〉江西〉陕西〉山西>
内蒙〉贵州〉甘肃>
青海〉宁夏
2、实验步骤:
1.打开数据文件“某市工业企业效益指标。
2.选择菜单“分析→降维→因子分析”,弹出“因子分析”对话框。
在对话框左侧的变量列表中选变量x1至x7,进入“变量”框,如图2—1。
描述统计”对话框,在“统计量”中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数”,计算相关系数矩阵,并选“KMO和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2-2。
图2—1
图2—2
4.单击“抽取"
按钮,弹出“因子分析:
方法提取因子,如图2-3.
图2-3
5.单击“旋转"
对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图2—4.
6.单击“得分”按钮,弹出“因子分析:
得分”对话框,选择“回归”项估计因子得分系数,如图2—5。
图2-4
图2—5
表2—1
表2-1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表2-2
由表2—2可知,巴特利特球度检验统计量观测值为136。
426,相应的概率p值接近0,如果显著性水平α为0。
05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0。
表2—3
表2—4
表2—3和表2—4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标.方差分解表也表明前两个因子能够解释7个指标的84。
619%。
综合以上,提取前两个因子最好了。
表2—5
表2—6
由表2—5、表2—6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释。
因子1主要解释的是固定资产产值率、固定资产利税率、资金利润率、资金利税率和销售收入利税率,可以命名为盈利能力因子;
而因子2主要解释的是其余两个指标,流动资金周转天数、和全员劳动生产率。
可以命名为资金和人力因子。
因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关.可见,对因子进行旋转是完全有必要的.
表2-7
根据表2—7可写出以下因子得分函数:
F1=0.238固定资产产值率+0.191固定资产利税率+0.265资金利润率+0。
270资金利税率+0.173流动资金周转天数+0.135销售收入利税率—0。
046全员劳动生产率
F2=—0。
087固定资产产值率+0。
096固定资产利税率—0.126资金利润率—0。
160资金利税率—0.627流动资金周转天数+0.167销售收入利税率+0。
477全员劳动生产率
(5)计算综合得分。
单击“转换→计算变量"
并输入其计算公式FAC1_1*0。
66259+FAC2_1*0。
18360.将FAC1_1、FAC2_1和score原始变量标准化后,保存为新变量ZFAC1_1、ZFAC2_1和zscore然后,分别按ZFAC1_1、ZFAC2_1和zscore排序。
得到因子得分值及排序表如表2-8所示。
企业
盈利能力
资金和人力
综合得分
ZFAC1_1
名次
ZFAC2_1
Zscore
数源科技
13056
1
-0.64627
88062
中华电子
—0。
64627
21107
1.64163
2
潮州二轻
1.23755
-0.8872
9557
3
南方制药
69559
4
48185
799
五羊自行
0.27476
5
0757
285
茂名石化
37374
1.89659
14628
白云制药
19232
—0.71098
—0.00452
7
广发卷烟
-0。
38166
057
-0.35258
8
康佳电子
—0.56141
0.69404
—0.35569
9
华南冰箱
09552
—1.09997
38577
岭南通信
34094
24467
3939
华空空调
58518
—0.33462
65328
中国长城
36788
—1。
26789
15
—0.69309
稀土高科
87028
29465
91736
三星集团
—2。
04498
07001
95203
表2—8