多元统计正交因子分析实验报告.docx

上传人:b****0 文档编号:18282439 上传时间:2023-08-15 格式:DOCX 页数:16 大小:23.38KB
下载 相关 举报
多元统计正交因子分析实验报告.docx_第1页
第1页 / 共16页
多元统计正交因子分析实验报告.docx_第2页
第2页 / 共16页
多元统计正交因子分析实验报告.docx_第3页
第3页 / 共16页
多元统计正交因子分析实验报告.docx_第4页
第4页 / 共16页
多元统计正交因子分析实验报告.docx_第5页
第5页 / 共16页
多元统计正交因子分析实验报告.docx_第6页
第6页 / 共16页
多元统计正交因子分析实验报告.docx_第7页
第7页 / 共16页
多元统计正交因子分析实验报告.docx_第8页
第8页 / 共16页
多元统计正交因子分析实验报告.docx_第9页
第9页 / 共16页
多元统计正交因子分析实验报告.docx_第10页
第10页 / 共16页
多元统计正交因子分析实验报告.docx_第11页
第11页 / 共16页
多元统计正交因子分析实验报告.docx_第12页
第12页 / 共16页
多元统计正交因子分析实验报告.docx_第13页
第13页 / 共16页
多元统计正交因子分析实验报告.docx_第14页
第14页 / 共16页
多元统计正交因子分析实验报告.docx_第15页
第15页 / 共16页
多元统计正交因子分析实验报告.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

多元统计正交因子分析实验报告.docx

《多元统计正交因子分析实验报告.docx》由会员分享,可在线阅读,更多相关《多元统计正交因子分析实验报告.docx(16页珍藏版)》请在冰点文库上搜索。

多元统计正交因子分析实验报告.docx

多元统计正交因子分析实验报告

正交因子分析(设计性实验)

(Orthogonalfactoranalysis)

实验原理:

因子分析是主成分分析的推广和发展,其目的是用少数几个不可观测的隐变量,即因子,来解释原始变量之间的相关关系,它也是属于多元分析中处理降维的一种统计方法。

因子分析的基本思想是通过变量间的协方差矩阵(或相关系数矩阵)内部结构的研究,寻找能控制所有变量的少数几个因子去描述多个变量之间的相关关系。

因子分析中最常用的数学模型是正交因子模型,其特点是模型中的因子相互之间正交。

实验题目一:

下表中给出了二战以来奥运会运动员十项运动成绩的相关系数矩阵:

(E9a6)

100米1.00.........

跳远0.591.00........

铅球0.350.421.00.......

跳高0.340.510.381.00......

400米0.630.490.190.291.00.....

110米跨栏0.400.520.360.460.341.00....

铁饼0.280.310.730.270.170.321.00...

撑竿跳高0.200.360.240.390.230.330.241.00..

标枪0.110.210.440.170.130.180.340.241.00.

1500米-0.070.09-0.080.180.390.00-0.020.17-0.001.00

实验要求:

(1)试由相关系数矩阵作因子分析;covmat

(2)试根据因子载荷,并结合题目背景知识,对公共因子进行命名。

实验题目二:

下表中给出了不同国家及地区的女子径赛记录:

(t1a7)

Country

100m(s)

200m(s)

400m(s)

800m(min)

1500m(min)

3000m(min)

Marathon(min)

argentin

11.61

22.94

54.5

2.15

4.43

9.79

178.52

australi

11.2

22.35

51.08

1.98

4.13

9.08

152.37

austria

11.43

23.09

50.62

1.99

4.22

9.34

159.37

belgium

11.41

23.04

52

2

4.14

8.88

157.85

bermuda

11.46

23.05

53.3

2.16

4.58

9.81

169.98

brazil

11.31

23.17

52.8

2.1

4.49

9.77

168.75

burma

12.14

24.47

55

2.18

4.45

9.51

191.02

canada

11

22.25

50.06

2

4.06

8.81

149.45

chile

12

24.52

54.9

2.05

4.23

9.37

171.38

china

11.95

24.41

54.97

2.08

4.33

9.31

168.48

columbia

11.6

24

53.26

2.11

4.35

9.46

165.42

cookis

12.9

27.1

60.4

2.3

4.84

11.1

233.22

costa

11.96

24.6

58.25

2.21

4.68

10.43

171.8

czech

11.09

21.97

47.99

1.89

4.14

8.92

158.85

denmark

11.42

23.52

53.6

2.03

4.18

8.71

151.75

domrep

11.79

24.05

56.05

2.24

4.74

9.89

203.88

finland

11.13

22.39

50.14

2.03

4.1

8.92

154.23

france

11.15

22.59

51.73

2

4.14

8.98

155.27

gdr

10.81

21.71

48.16

1.93

3.96

8.75

157.68

frg

11.01

22.39

49.75

1.95

4.03

8.59

148.53

gbni

11

22.13

50.46

1.98

4.03

8.62

149.72

greece

11.79

24.08

54.93

2.07

4.35

9.87

182.2

guatemal

11.84

24.54

56.09

2.28

4.86

10.54

215.08

hungary

11.45

23.06

51.5

2.01

4.14

8.98

156.37

india

11.95

24.28

53.6

2.1

4.32

9.98

188.03

indonesi

11.85

24.24

55.34

2.22

4.61

10.02

201.28

ireland

11.43

23.51

53.24

2.05

4.11

8.89

149.38

israel

11.45

23.57

54.9

2.1

4.25

9.37

160.48

italy

11.29

23

52.01

1.96

3.98

8.63

151.82

japan

11.73

24

53.73

2.09

4.35

9.2

150.5

kenya

11.73

23.88

52.7

2

4.15

9.2

181.05

korea

11.96

24.49

55.7

2.15

4.42

9.62

164.65

dprkorea

12.25

25.78

51.2

1.97

4.25

9.35

179.17

luxembou

12.03

24.96

56.1

2.07

4.38

9.64

174.68

malaysia

12.23

24.21

55.09

2.19

4.69

10.46

182.17

mauritiu

11.76

25.08

58.1

2.27

4.79

10.9

261.13

mexico

11.89

23.62

53.76

2.04

4.25

9.59

158.53

netherla

11.25

22.81

52.38

1.99

4.06

9.01

152.48

nz

11.55

23.13

51.6

2.02

4.18

8.76

145.48

norway

11.58

23.31

53.12

2.03

4.01

8.53

145.48

png

12.25

25.07

56.96

2.24

4.84

10.69

233

philippi

11.76

23.54

54.6

2.19

4.6

10.16

200.37

poland

11.13

22.21

49.29

1.95

3.99

8.97

160.82

portugal

11.81

24.22

54.3

2.09

4.16

8.84

151.2

rumania

11.44

23.46

51.2

1.92

3.96

8.53

165.45

singapor

12.3

25

55.08

2.12

4.52

9.94

182.77

spain

11.8

23.98

53.59

2.05

4.14

9.02

162.6

sweden

11.16

22.82

51.79

2.02

4.12

8.84

154.48

switzerl

11.45

23.31

53.11

2.02

4.07

8.77

153.42

taipei

11.22

22.62

52.5

2.1

4.38

9.63

177.87

thailand

11.75

24.46

55.8

2.2

4.72

10.28

168.45

turkey

11.98

24.44

56.45

2.15

4.37

9.38

201.08

usa

10.79

21.83

50.62

1.96

3.95

8.5

142.72

ussr

11.06

22.19

49.19

1.89

3.87

8.45

151.22

wsamoa

12.74

25.85

58.73

2.33

5.81

13.04

306

(数据来源:

1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)

ussr

11.06

22.19

49.19

1.89

3.87

8.45

151.22

rumania

11.44

23.46

51.2

1.92

3.96

8.53

165.45

实验要求:

(1)根据以上数据对女子径赛项目作因子分析;

(2)对公共因子进行解释;

(3)计算各个国家的第一因子得分并进行排名。

要求列出排名前10的国家或地区,并给出中国的名次。

实验题目一分析报告:

R程序:

record<-read.table("data4.txt",head=F)#导入数据

record<-record[,-1]#删除第一列

record<-as.matrix(record)#将原数据矩阵化

options(digits=2)#保留两位小数

pca.data1<-princomp(covmat=record)

#以相关系数矩阵作为基础,建立主成分分析

summary(pca.data1)#输出主成分分析报表

fact1.st<-factanal(covmat=record,factors=5,rotation="none")#作因子分析,不旋转

fact1.ro<-factanal(covmat=record,factors=5,rotation="varimax")#作因子分析,旋转

fact1.st#输出不旋转的结果

fact1.ro#输出旋转的结果

apply((fact1.ro$loadings)^2,1,sum)#计算共同度

fact2.ro<-factanal(covmat=record,factors=4,rotation="varimax")#作因子分析,旋转

fact2.ro#输出旋转的结果

apply((fact2.ro$loadings)^2,1,sum)#计算共同度

输出结果及分析:

(1)试由相关系数矩阵作因子分析;

record<-read.table("data4.txt",head=F)#导入数据

record<-record[,-1]#删除第一列

record<-as.matrix(record)#将原数据矩阵化

options(digits=2)#保留两位小数

pca.data1<-princomp(covmat=record)

#以相关系数矩阵作为基础,建立主成分分析

summary(pca.data1)#输出主成分分析报表

为了确定因子分析中因子的数目,我们先对相关系数矩阵做主成分分析

表1主成分分析报表

Comp.1

Comp.2

Comp.3

Comp.4

Comp.5

Comp.6

Comp.7

Comp.8

Comp.9

Comp.10

Standarddeviation

1.95

1.23

1.06

0.956

0.849

0.771

0.726

0.619

0.485

0.456

ProportionofVariance

0.38

0.15

0.11

0.091

0.072

0.059

0.053

0.038

0.024

0.021

CumulativeProportion

0.38

0.53

0.64

0.733

0.805

0.865

0.917

0.956

0.979

1.000

由方差累计贡献率得到,在第五主成分,累积贡献率达到了80%以上,并趋于稳定。

我们确定因子分析中因子数目为5.

fact1.st<-factanal(covmat=record,factors=5,rotation="none")#作因子分析,不旋转

fact1.ro<-factanal(covmat=record,factors=5,rotation="varimax")#作因子分析,旋转

fact1.st#输出不旋转的结果

fact1.ro#输出旋转的结果

apply((fact1.ro$loadings)^2,1,sum)#计算共同度

做因子分析,得到未旋转的因子载荷以及旋转的因子载荷

表2未旋转的因子载荷

Factor

Factor1

Factor2

Factor3

Factor4

Factor5

100米

0.208

0.791

0.301

-0.167

跳远

0.378

0.595

0.246

0.242

铅球

0.644

0.761

跳高

0.415

0.344

0.157

0.471

-0.139

400米

0.446

0.688

-0.113

-0.203

0.116

110米跨栏

0.265

0.435

0.261

0.343

铁饼

0.503

0.534

撑竿跳高

0.307

0.240

0.402

0.214

标枪

0.313

0.314

0.378

1500米

0.707

-0.704

累积贡献率

0.2

0.38

0.55

0.616

0.640

表3旋转的因子载荷

Factor

Factor1

Factor2

Factor3

Factor4

Factor5

Communalities

100米

0.171

0.815

0.276

-0.141

0.79

跳远

0.223

0.480

0.580

0.62

铅球

0.955

0.139

0.241

1.00

跳高

0.211

0.152

0.687

0.117

0.56

400米

0.760

0.193

0.326

0.126

0.74

110米跨栏

0.187

0.278

0.565

0.45

铁饼

0.693

0.125

0.194

0.111

0.55

撑竿跳高

0.112

0.501

0.119

0.282

0.36

标枪

0.408

0.140

0.401

0.35

1500米

0.989

1.00

累积贡献率

0.17

0.34

0.50

0.61

0.640

观察表格中被标注为绿色的两个因子载荷(标枪项目一行),在Factor1中的因子载荷为0.408,在Factor5中的因子载荷为0.401,比较两个因子载荷,0.408>0.401,因此我们最终选取0.408。

这样一来,我们做因子分时,只需要4个因子即可。

因此,我们下面再做4个因子的旋转因子分析。

fact2.ro<-factanal(covmat=record,factors=4,rotation="varimax")#作因子分析,旋转

fact2.ro#输出旋转的结果

apply((fact2.ro$loadings)^2,1,sum)#计算共同度

表4旋转的因子载荷

Factor

Factor1

Factor2

Factor3

Factor4

Communalities

100米

0.167

0.857

0.246

-0.138

0.84

跳远

0.239

0.476

0.581

0.62

铅球

0.963

0.153

0.201

1.00

跳高

0.242

0.172

0.632

0.113

0.50

400米

0.710

0.236

0.331

0.67

110米跨栏

0.205

0.261

0.588

0.46

铁饼

0.699

0.133

0.179

0.54

撑竿跳高

0.138

0.512

0.117

0.30

标枪

0.418

0.175

0.21

1500米

0.113

0.988

1.00

累积贡献率

0.18

0.34

0.50

0.61

(2)试根据因子载荷,并结合题目背景知识,对公共因子进行命名

由旋转后的载荷可发现,第一因子中,铅球、铁饼和标枪的载荷较大,可命名为投掷因子;第二因子中,100米和400米的载荷较大,可命名为短跑因子;第三因子中,跳远、跳高、110米跨栏、撑竿跳高较大,可命名为弹跳因子;第四因子中,1500米的载荷较大,可命名为长跑因子。

实验题目二分析报告:

R程序:

b<-read.csv("data42.csv")#导入数据

b1<-b[,-1]#删除第一列

pc.b1<-princomp(b1,cor=T)#做主成分分析

summary(pc.b1)#主成分分析结果

fact.b1<-factanal(b1,factor=2,method="mle",rotation="none")#未旋转的因子分析

fact.b1$loadings#输出不旋转的结果

fact.b2<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="regression")

#旋转的因子分析

fact.b2$loadings#输出旋转的结果

apply((fact.b2$loadings)^2,1,sum)#计算共同度

shapiro.test(fact.b2$scores)#检验正态性

fact.b3<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="Bartlett")

b[order(fact.b3$scores[,1],decreasing=F),1]#排名

输出结果及分析:

(1)根据以上数据对女子径赛项目作因子分析;

b<-read.csv("data42.csv")#导入数据

b1<-b[,-1]

pc.b1<-princomp(b1,cor=T)

summary(pc.b1)

表4主成分分析结果

Comp.1

Comp.2

Comp.3

Comp.4

Comp.5

Comp.6

Comp.7

Standarddeviation

2.41

0.808

0.548

0.354

0.2320

0.1976

0.1498

ProportionofVariance

0.83

0.093

0.043

0.018

0.0077

0.0056

0.0032

CumulativeProportion

0.83

0.923

0.966

0.984

0.9912

0.9968

1.0000

根据主成分分析的结果可以看出,在第2个特征根处,累计贡献率就已经达到了92.3%。

因此,我们选用2个因子进行因子分析。

fact.b1<-factanal(b1,factor=2,method="mle",rotation="none")

fact.b1$loadings

fact.b2<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="regression")

fact.b2$loadings

apply((fact.b2$loadings)^2,1,sum)

表5未旋转的因子载荷

Factor1

Factor2

X100.m..s.

0.95

-0.13

X200.m..s.

0.97

-0.22

X400.m..s.

0.90

0

X800.m..min.

0.83

0.38

X1500.m..min.

0.84

0.53

X3000.m..min.

0.84

0.49

Marathon..min.

0.80

0.40

表6旋转的因子载荷

Factor1

Factor2

Communalities

X100.m..s.

0.44

0.85

0.92

X200.m..s.

0.38

0.92

1

X400.m..s.

0.57

0.69

0.81

X800.m..min.

0.78

0.46

0.83

X1500.m..min.

0.92

0.38

0.99

X3000.m..min.

0.89

0.40

0.95

Marathon..min.

0.79

0.42

0.8

累积贡献率

0.50

0.90

1

得到旋转前后的载荷矩阵

(2)对公共因子进行解释;

由旋转后的载荷可发现,第一因子中,标枪和铁饼800m、1500m、3000m、马拉松载荷较大,可命名为长跑因子;第二因子中,100米、200米、400米的载荷较大,可命名为短跑因子;

(3)计算各个国家的第一因子得分并进行排名。

要求列出排名前10的国家或地区,并给出中国的名次。

fact.b2<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="regression")

shapiro.test(fact.b2$scores)

fact.b3<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="Bartlett")

b[order(fact.b3$scores[,1],decreasing=F),1]

我们先对用线性回归方法得到的因子进行正态性检验,得到p值为7.787e-06,小于0.05,拒绝原假设为正态分布,因子不为正态,说明原始数据也不是正态分布,所以不能用要求用正态假设的Regression方法做因子得分,因子得分选用Bartlett方法。

排名

国家

1

dp

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 司法考试

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2