数据分析方法课程设计报告文档格式.docx

上传人:b****1 文档编号:4095918 上传时间:2023-05-02 格式:DOCX 页数:24 大小:22.04KB
下载 相关 举报
数据分析方法课程设计报告文档格式.docx_第1页
第1页 / 共24页
数据分析方法课程设计报告文档格式.docx_第2页
第2页 / 共24页
数据分析方法课程设计报告文档格式.docx_第3页
第3页 / 共24页
数据分析方法课程设计报告文档格式.docx_第4页
第4页 / 共24页
数据分析方法课程设计报告文档格式.docx_第5页
第5页 / 共24页
数据分析方法课程设计报告文档格式.docx_第6页
第6页 / 共24页
数据分析方法课程设计报告文档格式.docx_第7页
第7页 / 共24页
数据分析方法课程设计报告文档格式.docx_第8页
第8页 / 共24页
数据分析方法课程设计报告文档格式.docx_第9页
第9页 / 共24页
数据分析方法课程设计报告文档格式.docx_第10页
第10页 / 共24页
数据分析方法课程设计报告文档格式.docx_第11页
第11页 / 共24页
数据分析方法课程设计报告文档格式.docx_第12页
第12页 / 共24页
数据分析方法课程设计报告文档格式.docx_第13页
第13页 / 共24页
数据分析方法课程设计报告文档格式.docx_第14页
第14页 / 共24页
数据分析方法课程设计报告文档格式.docx_第15页
第15页 / 共24页
数据分析方法课程设计报告文档格式.docx_第16页
第16页 / 共24页
数据分析方法课程设计报告文档格式.docx_第17页
第17页 / 共24页
数据分析方法课程设计报告文档格式.docx_第18页
第18页 / 共24页
数据分析方法课程设计报告文档格式.docx_第19页
第19页 / 共24页
数据分析方法课程设计报告文档格式.docx_第20页
第20页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数据分析方法课程设计报告文档格式.docx

《数据分析方法课程设计报告文档格式.docx》由会员分享,可在线阅读,更多相关《数据分析方法课程设计报告文档格式.docx(24页珍藏版)》请在冰点文库上搜索。

数据分析方法课程设计报告文档格式.docx

40

2.2

66

41

44

1.8

70

28

43

89

49

54

2.9

42

45

2.4

52

62

26

29

2.1

77

53

67

38

55

47

34

2.0

33

56

2.5

79

1.9

88

60

58

(1)拟合线性回归模型,通过残差分析与考察模型及有关误差分布正态性假定的合理性;

(2)若

(1)中模型合理,分别在,,准则下选择最优回归方程,各准则下的选择结果是否一致?

(3)对,用逐步回归法选择最优回归方程,其结果和

(2)中的数否一致?

(4)对选择的最优回归方程作残差分析,与

(1)中的相应结果比较,有何变化?

习题2.6

(1)回归参数的的最小二乘估计为:

在MATLAB中输入程序(见程序代码清单二)可得:

,,

所以回归方程为:

对数据做Box-Cox变换,(由于的取值在能力范围不好确定,所以经测试,

取=0.6进行Box-Cox变换

习题2.9

根据所建立的模型,在MATLAB中输入程序,得到以下结果:

(1)所得到的回归方程为:

(2)所得到的学生化残差见附录,通过对残差的分析,很明显不符合正态分布所以(

1)

中所建立的模型不合理。

4.程序代码清单:

习题2.4

x=[12742450

11803254

13753802

12052838

1862347

12653782

1983008

13302450

11952137

1532560

14304020

13724427

12362660

11572088

13702605];

y=[162

120

223

131

169

81

192

116

252

232

144

103

212];

n=15;

p=3

b=inv(x'

*x)*x'

*y

h=x*inv(x'

;

sse=y'

*(eye(n,n)-h)*y

d2=1/(n-p)*y'

sst=y'

*(eye(n,n)-(1/n)*ones(n,n))*y

ssr=y'

*(h-1/n*ones(n,n))*y

msr=ssr/(p-1)

mse=sse/(n-p)

f=msr/mse

r2=1-sse/sst

x=[18.370

18.665

18.863

110.572

110.781

110.883

111.066

111.075

111.180

111.275

111.379

111.476

111.769

112.075

112.974

112.985

113.386

113.771

113.864

114.078

114.280

114.574

116.072

116.377

117.381

117.582

117.980

118.080

120.687];

y=[10.3

10.3

10.2

16.4

18.8

19.7

15.6

18.2

22.6

19.9

24.2

21.0

21.4

21.3

19.1

22.2

33.8

27.4

25.7

24.9

34.5

31.7

36.3

38.3

42.6

55.4

55.7

58.3

51.5

51.0

77.0];

n=31;

p=3;

*y;

fori=1:

n

a=h(2*(i-1)+i)

end

t=sqrt((mse-mse*a))

q=y-(-57.9877+4.7082*x(:

2:

2)+0.3393*x(:

3:

3))

r=q/t

程序三

m=0:

0.01:

1;

y=(y.^m-1)/m

a=[150512.348

136462.357

140482.266

141441.870

128431.889

149542.936

142502.246

145482.454

152622.926

129502.177

129482.489

143532.467

138552.247

134512.351

153542.257

136492.066

133562.579

129461.988

133492.160

155512.449

129522.377

144582.952

143502.360]

y=a(:

5:

5)

x=a(:

1:

4)

n=23;

p=4;

q=y-(162.8575-1.2103*x(:

2)-0.6659*x(:

3)-8.613*x(:

4:

4))

附录:

习题2.6学生化残差

r=

1.3857

1.4578

1.3656

0.1325

-0.2725

-0.3358

-0.1514

-0.2665

0.3002

-0.0740

0.5535

-0.1200

-0.0184

0.2006

-1.2333

-1.4358

0.5614

-1.6275

-1.2451

-0.9648

0.0273

-1.0948

0.2312

-0.8816

-0.5793

1.1303

0.8813

1.2355

-0.6102

-0.7372

2.1526

习题2.9学生化残差

r=

-0.0558

-1.1563

0.2408

0.1530

0.4069

-0.6459

-1.3453

-0.1718

-0.7476

0.0609

1.3545

1.1860

-1.3953

-1.6533

1.2882

-0.3350

1.4551

0.7065

-1.1911

0.7166

0.3590

0.5853

0.2236

上课纪律(20%)实验过程及结果(40%)实验报告质量(40%)

总分:

教师签字:

(1)掌握主成份分析与典型相关分析的思想和计算步骤;

(2)编写程序完成主成份分析与典型相关性分析的计算;

1.计算样本主成分的步骤:

(1)计算样本协方差矩阵S和相关系数矩阵R:

(2)计算S的特征值和相应的正交化特征向量:

(3)第K个样本的得分样本方差:

(4)前M个样本主成分的累加贡献率:

(5)选取m(m<

p)个样本主成分,使其累计贡献率达到一定的要求(如80%到90%),以前m个主成分的得分代替原始数据,这样便可达到降低原始数据维数的目

的,同时也不致损失原始数据太多信息。

2.计算样本典型变量相关系数的步骤:

(1)计算样本的协方差矩阵:

(2)计算A,B矩阵的特征值和正交化向量

(3)第K个样本典型相关变量为:

习题4.5

在MATLAB中输入程序(见附录)

样本相关系数矩阵R为:

10.3336-0.0545-0.0613-0.28940.19880.34870.3187

0.3336

1

-0.0229

0.3989

-0.1563

0.7111

0.4136

0.835

-0.0545

0.5333

0.4968

0.0328

-0.1391

-0.2584

-0.0613

0.6984

0.4679

-0.1713

0.3128

-0.2894

0.2801

-0.2083

-0.0812

0.1988

0.4168

0.7016

0.3487

0.3187

对应的特征值为:

3.0963

2.3672

0.92

0.7059

0.4984

0.0515

0.1308

0.2299

所以各主成分的贡献率为:

X1

0.387

X5

0.0623

X2

0.2959

X6

0.0064

X3

0.115

X7

0.0163

X4

0.0882

X8

0.0287

前两个主成分的累加贡献率为:

0.3870+0.2959=0.6859各省市按照第一主成分排序,结果如下:

海南

河南

宁夏

西藏

广西

广东

陕西

湖北

辽宁

江苏

天津

内蒙古

山西

北京

四川

福建

甘肃

上海

黑龙江

新疆

青海

河北

吉林

浙江

湖南

云南

山东

安徽

贵州

江西

习题4.10

在MATLAB中输入程序(程序见清单二):

得到相关系数矩阵R:

0.9362

0.4934

0.7677

0.4166

0.9091

4程序清单:

清单一

a=[8.3523.53

7.51

8.62

17.42

10

1.04

11.21

9.25

23.75

6.61

9.19

17.77

10.48

1.72

10.51

8.19

30.5

4.72

9.78

16.28

7.62.52

10.32

7.73

29.2

5.42

9.43

19.29

8.49

2.52

9.42

27.93

8.2

8.14

16.17

1.55

9.76

9.16

27.98

9.01

9.32

15.99

9.11.82

11.35

10.06

28.64

10.52

10.05

16.18

8.39

1.96

10.81

9.09

28.12

7.4

9.62

17.26

11.12

2.49

12.65

9.41

28.2

5.77

10.8

16.36

11.56

1.53

12.17

8.728.12

7.21

10.53

19.45

13.3

1.66

11.96

6.93

29.85

4.54

9.49

16.62

10.65

1.88

13.61

8.67

36.05

7.31

7.75

16.67

11.68

2.38

12.88

9.98

37.69

7.01

8.94

16.15

11.08

0.83

11.67

6.77

38.69

6.01

8.82

14.79

11.44

1.74

13.23

37.75

9.61

13.15

1.28

11.28

7.67

35.71

8.04

8.31

15.13

7.76

1.41

13.25

7.939.77

12.94

19.27

11.05

2.04

13.29

7.18

40.91

7.32

17.6

12.75

1.14

14.8

33.7

7.59

10.98

18.82

14.73

1.78

10.1

6.25

35.02

6.28

10.03

7.15

1.93

10.39

10.6

52.41

7.79.98

12.53

11.7

2.31

14.69

7.27

52.65

3.84

13.03

15.26

1.98

14.57

13.45

55.85

5.57.45

9.55

9.52

2.21

16.3

10.85

44.68

14.51

17.13

12.08

1.26

11.57

45.79

7.66

10.36

16.56

12.86

2.25

11.69

7.68

50.37

19.25

14.59

2.75

14.87

7.78

48.44

8

20.51

22.12

15.73

1.15

16.61

7.94

39.65

20.97

20.82

22.52

12.41

1.75

7.9

8.28

64.34

22.22

20.06

15.12

0.72

22.89

12.47

76.39

5.52

11.24

14.52

22

5.46

25.5];

r=corrcoef(a);

b=eig(r)

e=b(i)/sum(b)

清单二:

a=[606962976998

56538410378107

8069766699130

5580908085114

62756811613091

746470109101103

64716677102130

737064115110109

6867757685119

69827472133127

606761130134121

707478150158100

667478150131142

8370749998105

68669011985109

78637516498138

1037777160117121

77687414471153

667768778289

70707211493122

7565717770109

917493118115150

667573170147121

758276153132115

747166143105100

767064114113129

74908673106116

7477801168177

677169638770

78758010513280

6466718394133

718076818786

6375731208959

9010374107109101

6076619911198

48777511312497

669397136112122

74707610988105

607471729071

63756613010190

668086130117144

7767748392107

7067100150142146

737681119120119

789077122155149

73688010290122

7283681046996

6560701199489

5270769294100];

b=a'

r=corrcoef(b);

r11=r(1:

3,1:

3);

r21=r(4:

6,1:

r12=r21'

r22=r(4:

6,4:

6);

R=corrcoef(inv(r11)*r12*inv(r22)*r21)

lamda=eig(R);

p=sqrt(lamda)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2