数据分析实验报告表分析解析.docx

上传人:b****1 文档编号:2390474 上传时间:2023-05-03 格式:DOCX 页数:28 大小:22.65KB
下载 相关 举报
数据分析实验报告表分析解析.docx_第1页
第1页 / 共28页
数据分析实验报告表分析解析.docx_第2页
第2页 / 共28页
数据分析实验报告表分析解析.docx_第3页
第3页 / 共28页
数据分析实验报告表分析解析.docx_第4页
第4页 / 共28页
数据分析实验报告表分析解析.docx_第5页
第5页 / 共28页
数据分析实验报告表分析解析.docx_第6页
第6页 / 共28页
数据分析实验报告表分析解析.docx_第7页
第7页 / 共28页
数据分析实验报告表分析解析.docx_第8页
第8页 / 共28页
数据分析实验报告表分析解析.docx_第9页
第9页 / 共28页
数据分析实验报告表分析解析.docx_第10页
第10页 / 共28页
数据分析实验报告表分析解析.docx_第11页
第11页 / 共28页
数据分析实验报告表分析解析.docx_第12页
第12页 / 共28页
数据分析实验报告表分析解析.docx_第13页
第13页 / 共28页
数据分析实验报告表分析解析.docx_第14页
第14页 / 共28页
数据分析实验报告表分析解析.docx_第15页
第15页 / 共28页
数据分析实验报告表分析解析.docx_第16页
第16页 / 共28页
数据分析实验报告表分析解析.docx_第17页
第17页 / 共28页
数据分析实验报告表分析解析.docx_第18页
第18页 / 共28页
数据分析实验报告表分析解析.docx_第19页
第19页 / 共28页
数据分析实验报告表分析解析.docx_第20页
第20页 / 共28页
亲,该文档总共28页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数据分析实验报告表分析解析.docx

《数据分析实验报告表分析解析.docx》由会员分享,可在线阅读,更多相关《数据分析实验报告表分析解析.docx(28页珍藏版)》请在冰点文库上搜索。

数据分析实验报告表分析解析.docx

数据分析实验报告表分析解析

 

实验课程:

数据分析

 

专业:

信息与计算科学

 

班级:

 

学号:

 

姓名:

 

中北大学理学院

 

..

..

 

实验一SAS系统的使用

 

【实验目的】

 

了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。

 

【实验内容】

 

1.将SCORE数据集的内容复制到一个临时数据集test。

 

SCORE数据集

Name

Sex

Math

Chinese

English

Alice

f

90

85

91

Tom

m

95

87

84

Jenny

f

93

90

83

Mike

m

80

85

80

Fred

m

84

85

89

Kate

f

97

83

82

Alex

m

92

90

91

Cook

m

75

78

76

Bennie

f

82

79

84

Hellen

f

85

74

84

Winceletf

90

82

87

Butt

m

77

81

79

Geoge

m

86

85

82

Tod

m

89

84

84

 

word教育资料

..

 

Chris

f

89

84

87

Janet

f

86

65

87

2.将SCORE数据集中的记录按照

math的上下拆分到

3个不同的数据集:

math

大于等于90的到good数据集,math在80到89之间的到normal数据集,math

在80以下的到bad数据集。

3.将3题中得到的good,normal,bad数据集合并。

 

【实验所使用的仪器设备与软件平台】SAS

 

【实验方法与步骤】

 

1:

DATASCORE;

INPUTNAME$Sex$MathChineseEnglish;

CARDS;

Alice

f

90

85

91

Tomm

95

87

84

Jenny

f

93

90

83

Mike

m

80

85

80

Fred

m

84

85

89

Kate

f

97

83

82

Alex

m

92

90

91

Cook

m

75

78

76

Bennie

f

82

79

84

Hellen

f

85

74

84

Winceletf

90

82

87

Butt

m

77

81

79

Geoge

m

86

85

82

Todm

89

84

84

Chris

f

89

84

87

Janet

f

86

65

87

;

Run;

PROCPRINTDATA=SCORE;

DATAtest;

SETSCORE;

2:

DATAgoodnormalbad;

SETSCORE;

 

word教育资料

..

 

SELECT;

when(math>=90)outputgood;

when(math>=80&math<90)outputnormal;

when(math<80)outputbad;

end;

Run;

PROCPRINTDATA=good;

PROCPRINTDATA=normal;

PROCPRINTDATA=bad;

3:

DATAAll;

SETgoodnormalbad;

PROCPRINTDATA=All;

Run;

 

【实验结果】

 

结果一:

 

结果二:

 

word教育资料

..

 

结果三:

 

word教育资料

..

 

word教育资料

..

 

实验二上市公司的数据分析

 

【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟悉

 

数据分析方法,培养学生分析处理实际数据的综合能力。

 

【实验内容】表2是一组上市公司在

2001年的每股收益〔eps〕、流通盘(scale)

的规模以及2001年最后一个交易日的收盘价(price).

表2

某上市公司的数据表

代码

流通盘

每股收益

股票价格

000096

8500

000099

6000

000150

12600

000151

10500

000153

2500

000155

13000

000156

3600

000157

10000

000158

10000

000159

7000

000301

15365

000488

7700

000725

6000

000835

1338

000869

3200

000877

7800

000885

6000

000890

16934

000892

12000

000897

14166

000900

21423

000901

4800

000902

6500

000903

6000

000905

9500

000906

6650

000908

8988

000909

6000

000910

8000

000911

7280

000912

15000

000913

8450

000915

4599

000916

34000

000917

11800

000918

6000

 

word教育资料

..

 

1、对股票价格

 

1〕计算均值、方差、标准差、变异系数、偏度、峰度;

 

2〕计算中位数,上、下四分位数,四分位极差,三均值;

 

3〕作出直方图;

 

4〕作出茎叶图;

 

5〕进行正态性检验〔正态W检验〕;

 

6〕计算协方差矩阵,Pearson相关矩阵;

 

7〕计算Spearman相关矩阵;

 

8〕分析各指标间的相关性。

 

2、1〕对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计

 

值及残差;

 

2〕给定显著性水平α=0.05,检验回归关系的显著性,检验各自变量对因变量的影响的显著性;

 

3〕拟合残差关于拟合值

?

X2及X1X2

的残差图及残差的正态

QQ图。

分析

Y,X1

这些残差,并予以评述。

 

【实验所使用的仪器设备与软件平台】SAS

 

【实验方法与步骤】

data

prices;

input

numscaleepsprice;

cards;

000096

000099

000150

12600

000151

10500

 

word教育资料

..

 

000153

25000

.056

000155

13000

000156

36000

.033

000157

10000

000158

10000

000159

70000

.008

000301

15365

000488

77000

.101

000725

60000

.044

000835

13380

000869

32000

.194

000877

7800-

000885

6000-

000890

16934

000892

12000

000897

14166

000900

21423

000901

48000

.005

000902

6500-

000903

60000

.109

000905

95000

.046

000906

66500

.007

000908

89880

.006

000909

60000

.002

000910

80000

.036

000911

72800

.067

000912

15000

000913

84500

.062

000915

45990

.001

000916

34000

000917

11800

000918

6000-

run;

PROCPRINTDATA=prices;

run;

proc

meansdata=prices

meanvar

std

skewness

kurtosis

cv;

var

price;

output

out=result;

run;

proc

univariate

data=pricesplot

freq

normal;

var

price;

output

out=result2;

run;

proc

capability

data=pricesgraphics

noprint

;

 

word教育资料

..

 

histogram

price/normal;

run;

proc

corr

data=prices

pearson

spearmancovnosimple

;

var

price;

with

price;

run;

proc

reg

data=prices;

modelprice=scaleeps/

selection

=backwardnointpr

;

outputout=pricesp=p

r=r;

proc

print

data=prices;

run

 

【实验结果】

 

word教育资料

..

 

word教育资料

..

 

word教育资料

..

 

对于问题二结果:

 

word教育资料

..

 

word教育资料

..

 

word教育资料

..

 

实验三美国50个州七种犯罪比率的数据分析

 

【实验目的】通过使用SAS软件对实验数据进行主成分分析和因子分析,熟悉

 

数据分析方法,培养学生分析处理实际数据的综合能力。

 

【实验内容】表3给出的是美国50个州每100000个人中七种犯罪的比率数

 

据。

这七种犯罪是:

Murder〔杀人罪〕,Rape〔强奸罪〕,Robbery〔抢劫罪〕,Assault

 

〔斗殴罪〕,Burglary〔夜盗罪〕,Larceny〔偷盗罪〕,Auto〔汽车犯罪〕。

表3

美国50

个州七种犯罪的比率数据

State

Murder

Rape

Robbery

Assault

Burglary

Larceny

Auto

Alabama

Alaska

Arizona

Arkansas

California

Colorado

Connecticut

Delaware

Florida

Georgia

Hawaii

Idaho

Illinois

Indiana

Iowa

Kansas

Kentucky

Louisiana

Maine

Maryland

Massachusetts

Michigan

Minnesota

Mississippi

Missouri

Montana

Nebraska

Nevada

NewHampshire

NewJersey

 

word教育资料

..

 

NewMexico

NewYork

NorthCarolina

Ohio

NorthDakota

Oklahoma

Oregon

35061

Pennsylvania

RhodeIsland

SouthCarolina

SouthDakota

Tennessee

Texas

Utah

Vermont

Virginia

Washington

WestVirginia

Wisconsin

Wyoming

 

1、1〕分别用样本协方差矩阵和样本相关矩阵作主成分分析,二者的结果有何差

异?

2〕原始数据的变化可否由三个或者更少的主成分反映,对所选取的主成分给

出合理的解释。

3〕计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序.

2、从样本相关矩阵出发,做因子分析。

 

【实验所使用的仪器设备与软件平台】SAS

 

【实验方法与步骤】

 

首先将上述数据复制到excel,再通过SAS导入数据至数据集crime。

 

样本协方差矩阵做主成分分析:

procprincompcovariance;

run;

样本相关矩阵做主成分分析:

procprincompdata=work.crime;

run;

对第一样本主成分排序

 

word教育资料

..

 

procprincompdata=crimeout=defen;

run;

procsortdata=defen;

byprin1;

run;

procprintdata=defen;

run;

2、

 

程序:

procfactorscore;

run;

 

【实验结果】

 

word教育资料

..

 

word教育资料

..

 

word教育资料

..

 

word教育资料

..

 

word教育资料

..

 

实验四1991年全国各省、区、市城镇居民

 

月平均收入的数据分析

 

【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉数

 

据分析方法,培养学生分析处理实际数据的综合能力。

 

【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下表,变

 

量含义如下:

X1-人均生活费收入〔元/人〕;X2-人均全民所有制职工工资〔元/

 

人〕;X3-人均来源于全民标准工资〔元/人〕;X4-人均集体所有制工资〔元/人〕;

 

X5-人均集体职工标准工资〔元/人〕;X6-人均各种奖金及超额工资〔元/人〕;X7-

 

人均各种津贴〔元/人〕;X8-职工人均从工作单位得到的其他收入〔元

/人〕;X9-

个体劳动者收入〔元/人〕。

省(区市)

x1

x2

x3

x4

x5

x6

x7

x8

x9

北京

1

天津

1

河北

1

11

12

上海

1

31

山东

1

湖北

1

广西

1

海南

1

四川

1

1021

云南

1

新疆

1

山西

2

内蒙古

2

吉林

2

黑龙江

2

江西

2

河南

2

贵州

2

陕西

2

甘肃

2

青海

2

宁夏

2

 

word教育资料

..

 

辽宁

3

江苏

3

浙江

3

13

安徽

3

福建

3

湖南

3

124

广东

114

西藏

0

1、1〕判定广东、西藏两省区属于哪种收入类型,并用回代法及交叉确认法对误

判率作出估计。

2〕进行Bayes判别,并用回代法与交叉确认法验证判别结果。

2、1〕用最短距离法、最长距离法与类平均法聚类,画出谱系图,并写出分3

类的结果;

2〕快速聚类法聚类,并写出分3类的结果。

 

【实验所使用的仪器设备与软件平台】SAS

 

【实验方法与步骤】

 

1:

发现数据四川省X9数据存在异常,通过查阅课本170页表5.3可得此处数据应为1.21.

 

首先将上述数据建立excel表格,再通过SAS直接导入到名为shuju的数据集中。

 

将数据

省(区

x1

x2

x3

x4

x5

x6

x7

x8

x9

市)名

广东

114

西藏

0

导入‘daipang’数据集。

 

‘shuju’数据集删除最后两行运行以下程序

procdiscrimdata=shuju

testdata=daipangmethod=normal

listcrosslisttestlist;

classleixing;

varx1-x9;

 

word教育资料

..

 

run;

2:

将上述结果也导入至数据集SHUJU中

 

SINGLE(或SIN):

最短距离法.

 

procclusterdata=shujumethod=sinouttree=y1;

 

run;

 

proctreedata=y1nclusters=3out=z1;

 

run;

 

procprintdata=z1;

 

run;

 

COMPLETE(或COM):

最长距离法.

 

p

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2