多元统计分析 MATLAB.docx

上传人:b****1 文档编号:2957102 上传时间:2023-05-05 格式:DOCX 页数:22 大小:205.40KB
下载 相关 举报
多元统计分析 MATLAB.docx_第1页
第1页 / 共22页
多元统计分析 MATLAB.docx_第2页
第2页 / 共22页
多元统计分析 MATLAB.docx_第3页
第3页 / 共22页
多元统计分析 MATLAB.docx_第4页
第4页 / 共22页
多元统计分析 MATLAB.docx_第5页
第5页 / 共22页
多元统计分析 MATLAB.docx_第6页
第6页 / 共22页
多元统计分析 MATLAB.docx_第7页
第7页 / 共22页
多元统计分析 MATLAB.docx_第8页
第8页 / 共22页
多元统计分析 MATLAB.docx_第9页
第9页 / 共22页
多元统计分析 MATLAB.docx_第10页
第10页 / 共22页
多元统计分析 MATLAB.docx_第11页
第11页 / 共22页
多元统计分析 MATLAB.docx_第12页
第12页 / 共22页
多元统计分析 MATLAB.docx_第13页
第13页 / 共22页
多元统计分析 MATLAB.docx_第14页
第14页 / 共22页
多元统计分析 MATLAB.docx_第15页
第15页 / 共22页
多元统计分析 MATLAB.docx_第16页
第16页 / 共22页
多元统计分析 MATLAB.docx_第17页
第17页 / 共22页
多元统计分析 MATLAB.docx_第18页
第18页 / 共22页
多元统计分析 MATLAB.docx_第19页
第19页 / 共22页
多元统计分析 MATLAB.docx_第20页
第20页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

多元统计分析 MATLAB.docx

《多元统计分析 MATLAB.docx》由会员分享,可在线阅读,更多相关《多元统计分析 MATLAB.docx(22页珍藏版)》请在冰点文库上搜索。

多元统计分析 MATLAB.docx

多元统计分析MATLAB

《多元统计分析》

实验报告

姓名:

赵晴晴

 

学号:

176121115

 

日期:

2017.11.15

实验一:

主成分分析实验

表5-12各地区国有及国有控股工业企业主要经济效益指标(2007年)

地区

工业增加值率

总资产贡献率

资产负债率

流动资产周转次数

工业成本费用利润率

产品销售率

北京

25.92

5.52

34.04

2.05

7.93

99.19

天津

34.29

16.18

62.66

2.62

12.44

99.58

河北

29.46

11.87

61.02

2.53

7.23

99.34

山西

37.58

11.28

67.65

1.95

8.68

98.18

内蒙古

47.36

11.43

62.23

2.21

13.8

99.08

辽宁

28.73

8.86

60.88

2.17

4.14

99.21

吉林

30.31

15.14

58.53

2.66

9.26

95.97

黑龙江

52.12

33.67

55.26

2.56

32.94

99.21

上海

27.39

12.42

45.62

2.13

8.04

99.26

江苏

26.45

14.02

58.99

2.88

6.91

99.64

浙江

24.48

14.82

58.81

3.18

6.17

99.65

安徽

35.13

10.63

65.65

2.39

4.95

98.4

福建

29.76

12.67

59.34

2.41

8.11

99.54

江西

26.75

12

65.12

2.51

5.6

98.69

山东

31.6

17.64

59.02

2.94

9.91

99.36

河南

37.7

13.02

65.02

2.68

6.86

98.58

湖北

33.75

10.65

54.28

2.17

9.87

98.56

湖南

35.96

16.62

62.35

2.62

7

99.32

广东

32.84

17.68

48.65

2.88

12.85

99.36

广西

32.31

12.12

64.04

2.45

7.72

101.2

海南

35.02

13.59

49.41

2.34

14.5

101.23

重庆

32.96

11.97

59.24

2.03

5.97

96.58

四川

37

10.72

63.54

1.7

8.62

98.8

贵州

37.49

12.52

65.69

1.86

8.97

98.35

云南

41.22

20.94

49.16

1.85

12.44

99.42

西藏

63.03

3.32

20.4

0.53

10.76

90.38

陕西

43.67

16.61

57.28

1.91

17.82

98.36

甘肃

26.57

13.42

58.38

2.54

7.51

98.31

青海

41.62

14.58

63.15

1.92

26.59

98.11

宁夏

38.98

8.27

63.53

1.83

5.07

98.53

新疆

45.58

25.84

49.36

3.16

29.88

100.29

(1)根据指标的属性将原始数据统一趋势化。

(2)利用协方差、相关系数矩阵进行主成分分析,可否只用第一主成分排名。

(3)构造新的实对称矩阵,使得可以只用第一主成分排名。

(4)排名的结果是否合理?

为什么?

解:

(1)首先输入数据,程序如下:

A=[data];%data即为表5-12中的数据

[m,n]=size(A);m=31n=6

%根据指标的属性将原始数据统一趋势化,其中资产负债率为成本型,转换成效益型。

根据如下公式:

B=

=

,得出

A1=(A(:

1)-min(A(:

1)))./(max(A(:

1))-min(A(:

1)));

A2=(A(:

2)-min(A(:

2)))./(max(A(:

2))-min(A(:

2)));

A3=(max(A(:

3))-A(:

3))./(max(A(:

3))-min(A(:

3)));

A4=(A(:

4)-min(A(:

4)))./(max(A(:

4))-min(A(:

4)));

A5=(A(:

5)-min(A(:

5)))./(max(A(:

5))-min(A(:

5)));

A6=(A(:

6)-min(A(:

6)))./(max(A(:

6))-min(A(:

6)));

A=[A1,A2,A3,A4,A5,A6];则程序中统一趋势化后的矩阵A如下:

%详细数据见附件1

(2)①%利用相关系数矩阵进行主成分分析

R=corrcoef(A);

得到相关系数矩阵为:

%在指标中无明显的共性关系

[v,d]=eig(R);%计算特征值与特征向量

%输出结果显示,最大特征值对应的不是正向量,所以不能用第一主成分进行排名。

②%利用协方差矩阵进行主成分分析

R1=cov(A)

得到协方差矩阵为:

[v1,d1]=eig(R1);%计算特征值与特征向量

%输出结果显示,最大特征值对应的不是正向量,所以不能用第一主成分进行排名

综合①②所述,利用协方差和相关系数,最大特征值对应的都不是正向量,所以均不能用第一主成分进行排名。

(3)%由于第

(2)题结果,我们利用R矩阵进行主成分分析。

由R矩阵的定义

A=[data];%data即为表5-12中的数据

[m,n]=size(A);%计算原始数据维数

fori=1:

n

forj=1:

n

R2(i,j)=2*dot(A(:

i),A(:

j))./[sum(A(:

i).^2)+sum(A(:

j).^2)];%计算R矩阵R2

end

end

[v2,d2]=eig(R2);%R矩阵R2的特征值与特征向量

w=sum(d2)/sum(sum(d2));%计算贡献率

%输出结果显示,最大特征值对应的是正向量,且贡献率为71.68%,所以能用第一主成分进行排名。

F=[A-ones(m,1)*mean(A)]*d(:

6);%计算主成分第一主成分得分

[F1,I1]=sort(F,'descend');%给出各市名次的序号

[F2,I2]=sort(I1);%给出各市排名

plot(1:

m,F,'*');%主成分得分图

构造的实对称矩阵,最大特征值对应的是正向量,且其贡献率为71.68%,所以能用第一主成分进行排名,排名结果为:

海南

1

广东

9

内蒙古

17

贵州

25

广西

2

山东

10

四川

18

甘肃

26

新疆

3

河北

11

江西

19

山西

27

浙江

4

湖南

12

河南

20

青海

28

江苏

5

上海

13

湖北

21

重庆

29

天津

6

黑龙江

14

宁夏

22

吉林

30

福建

7

辽宁

15

安徽

23

西藏

31

云南

8

北京

16

陕西

24

 

(4)排名结果不合理,因为从第一主成分得分图可以看出,指标的属性并没有明显的区别:

建议利用总贡献率达到90%以上后运用加权得分的结果,再进行排名得出结果。

实验二:

聚类分析实验(K聚类)

2008年我国34个地区中的29个地区的城镇居民人均收入见表6-6。

解决以下问题:

表6-6城镇居民人均收入(单位:

元/人)

省(区、市)

工薪收入

经营净收入

财产性收入

转移性收入

北京

18738.96

778.36

452.75

7707.87

河北

8891.5

1078.67

224.86

3946.39

山西

9019.35

983.21

202.31

3654.11

内蒙古

10284.43

1555.31

324.64

3031.05

辽宁

9494.59

1483.3

248.04

4610.32

黑龙江

7393.39

1241.37

122.83

3506.48

上海

21791.11

1399.14

369.12

6199.77

江苏

12319.86

1999.61

307.31

5548.78

浙江

15538.83

3161.87

1324.94

4955.14

安徽

9302.38

959.43

293.92

3603.72

福建

12668.82

2185.13

952.91

3879.29

江西

9105.96

1106.31

265.35

2985.96

山东

12940.62

1194.4

346.9

3067.05

河南

9043.52

1161.96

156.46

3545.86

湖北

9474.81

1114.68

244.13

3340.65

湖南

9070.97

1575.08

316.48

3614.74

广东

15188.39

2405.92

701.25

3382.95

广西

10321.2

1314.4

441.15

3316.44

海南

8999.75

1311.38

396.89

2890.59

重庆

10957.62

788.26

205.94

3265.92

四川

9117

1040.14

262.9

3265.06

贵州

7811.16

770.86

110.9

3492.7

云南

8596.88

1165.96

849.45

3505.74

西藏

12314.69

303.34

138.08

891.42

陕西

9794.82

544

151.46

3356.85

甘肃

8354.63

638.76

65.33

2610.61

青海

8595.48

763.07

50.17

3458.63

宁夏

8793.54

1856.94

182.67

3285.49

新疆

9422.22

938.15

141.75

1976.49

(1)计算各样品间的欧氏距离、马氏距离和加权平方距离。

(2)运用谱系聚类法进行聚类,包括确定最优聚类数,选择合适的类间距离,同时作出谱系图。

(3)运用K均值聚类法进行聚类。

(4)综合分析以上不同的聚类法所得的聚类结果,能得到什么样的结论?

解:

(1)编写程序如下:

(详细数据见附件2)

X=[18738.96,778.36,452.75,7707.87;

8891.5,1078.67,224.86,3946.39;

...................................................

8793.54,1856.94,182.67,3285.49;

9422.22,938.15,141.75,1976.49];

①计算欧氏距离

d1=pdist(x,'euclidean');%计算各行之间的欧氏距离

为了得到距离矩阵,键入命令D=squareform(d1);%将行向量d1转变成一个方阵,结果为:

D=1.0e+04*

1至9列

01.05481.05360.96940.97771.21120.34620.68830.4925

..........................................................................................................................................................

1.09440.20470.17270.15070.26930.25591.30800.47240.7255

10至18列

1.02930.73301.07350.74391.05621.02501.05300.58330.9510

.........................................................................................................................................................

0.16390.40460.10780.36980.16300.13800.18010.61400.1684

19至27列

1.08790.89631.06031.17181.09920.93840.99541.15751.1005

........................................................................................................................................................

0.11040.20120.13340.22190.18900.31540.14830.12800.1709

28至29列

1.09411.0944

..............................

0.17190

D(i,j)表示x中的第i个个体与第j个个体之间的欧氏距离。

如矩阵D1中的第1行9列为4925,表示上海与浙江的欧氏距离为4925,其余类推。

②计算马氏距离

d2=pdist(x,'mahalanobis');%计算各行之间的马氏距离

D2=squareform(d2);%将行向量d2转变成一个方阵

得到结果如下:

1至9列

03.87943.93014.86014.08664.68453.47704.35625.4312

............................................................................................................................................................5.13272.22071.90091.27642.77102.22914.08973.48814.4293

10至18列

3.81364.71234.40774.35914.30624.18424.60895.56764.1955

............................................................................................................................................................1.98743.06481.25181.14221.73541.44992.00242.64961.6147

19至27列

4.60033.86284.15014.04974.79385.88523.68904.46344.0647

.........................................................................................................................................................

1.49001.33151.55492.11864.24892.43851.85131.16291.8173

28至29列

5.60645.1327

.................................

2.47780

 

 

附件1

A=

0.03740.07250.71130.57360.13160.8120

0.25450.42370.10560.78870.28820.8479

0.12920.28170.14030.75470.10730.8258

0.33980.262300.53580.15760.7189

0.59350.26720.11470.63400.33540.8018

0.11020.18250.14330.618900.8138

0.15120.38950.19300.80380.17780.5152

0.71701.00000.26220.76601.00000.8138

0.07550.29980.46620.60380.13540.8184

0.05110.35260.18330.88680.09620.8535

00.37890.18711.00000.07050.8544

0.27630.24090.04230.70190.02810.7392

0.13700.30810.17590.70940.13780.8442

0.05890.28600.05350.74720.05070.7659

0.18470.47180.18260.90940.20030.8276

0.34290.31960.05570.81130.09440.7558

0.24050.24150.28300.61890.19900.7539

0.29780.43820.11220.78870.09930.8240

0.21690.47310.40210.88680.30240.8276

0.20310.29000.07640.72450.12430.9972

0.27340.33840.38600.68300.35971.0000

0.22000.28500.17800.56600.06350.5714

0.32480.24380.08700.44150.15560.7760

0.33750.30310.04150.50190.16770.7346

0.43420.58060.39130.49810.28820.8332

1.000001.000000.22990

0.49780.43790.21950.52080.47500.7355

0.05420.33280.19620.75850.11700.7309

0.44460.37100.09520.52450.77950.7124

0.37610.16310.08720.49060.03230.7512

0.54730.74200.38710.99250.89380.9134

附件2

>>D=squareform(d1)

D1=1.0e+04*

1至9列

01.05481.05360.96940.97771.21120.34620.68830.4925

1.054800.03340.17360.09840.15731.31000.38960.7124

1.05360.033400.15270.11800.16551.30310.39400.7085

0.96940.17360.152700.17690.29541.19360.32680.5907

0.97770.09840.11800.176900.23891.24000.30220.6374

1.21120.15730.16550.29540.238901.46500.53900.8578

0.34621.31001.30311.19361.24001.46500.95130.6683

0.68830.38960.39400.32680.30220.53900.951300.3619

0.49250.71240.70850.59070.63740.85780.66830.36190

1.02930.05520.03030.12840.11520.19401.27630.37380.6829

0.73300.40030.39210.26830.34060.54360.94640.18330.3238

1.07350.09850.06880.12630.17120.18011.30900.42070.7114

0.74390.41470.39730.26810.37880.55690.93910.26820.3891

1.05620.04420.02150.14100.12030.16531.30250.39330.7038

1.02500.08420.05700.09760.13220.20951.26480.37090.6689

1.05300.06300.06060.13470.10880.17251.29810.38050.6868

0.58330.64770.63560.50040.59150.79040.72560.36390.1885

0.95100.15950.14060.03930.15570.29521.18270.30770.5840

1.08790.11000.08540.13170.18040.17431.32130.43090.7163

0.89630.21950.19860.10540.21050.36021.12420.29230.5543

1.06030.07200.04100.12990.14660.17581.30150.40490.7052

1.17180.12170.12410.26440.21470.06291.42560.51090.8309

1.09920.08240.08080.18710.15770.14081.34770.43620.7382

0.938

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2