《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx

上传人:b****4 文档编号:7135098 上传时间:2023-05-08 格式:DOCX 页数:72 大小:360KB
下载 相关 举报
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第1页
第1页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第2页
第2页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第3页
第3页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第4页
第4页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第5页
第5页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第6页
第6页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第7页
第7页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第8页
第8页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第9页
第9页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第10页
第10页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第11页
第11页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第12页
第12页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第13页
第13页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第14页
第14页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第15页
第15页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第16页
第16页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第17页
第17页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第18页
第18页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第19页
第19页 / 共72页
《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx_第20页
第20页 / 共72页
亲,该文档总共72页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx

《《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx》由会员分享,可在线阅读,更多相关《《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx(72页珍藏版)》请在冰点文库上搜索。

《多元统计分析》第三版例题习题数据文件人大何晓群Word格式.docx

8.46

39.92

.25

40.20

29.21

-2.19

大连热电

600719

1.58

.96

60.53

.32

.70

1.31

-3.44

.75

华电能源

600726

.33

77.63

2.39

1.08

12.66

-6.04

国电电力

600795

1.26

.20

71.65

.26

1.68

1.10

-5.88

5.68

房地行业

长春经开

600215

.09

.21

29.10

.05

.08

9.07

大龙地产

600159

1.21

61.63

.04

1.84

-57.90

-.08

金丰投资

600606

9.78

6.51

46.07

.31

6.22

-51.99

-8.40

新黄浦

600638

6.81

5.96

31.91

.12

5.57

-18.48

4.99

浦东金桥

600639

9.02

6.16

42.74

.86

4.51

40.62

4.75

外高桥

600648

6.90

2.09

78.11

2.47

7.04

19.88

5.21

中华企业

600675

14.31

6.82

63.67

.37

.44

5.89

33.93

11.82

渝开发A

000514

6.53

5.14

31.61

.14

4.42

-15.56

6.64

莱茵置业

000558

21.22

7.95

73.67

1.04

-13.15

28.42

粤宏远A

000573

-8.47

-4.84

44.12

.24

-3.90

-26.72

-7.81

中国国贸

600007

8.40

6.21

48.06

3.04

1.20

5.06

万科A

000002

12.65

5.77

67.44

10.62

15.38

8.93

三木集团

000632

1.96

1.05

80.12

.88

.95

-9.55

国兴地产

000838

2.97

2.21

44.34

.17

30.65

-74.76

3.06

中关村

000931

9.69

1.72

80.11

.47

2.03

-7.90

1.59

信息技术业

中兴通讯

000063

11.65

5.02

70.15

.98

4.28

27.36

17.40

长城电脑

000066

1.01

53.93

1.35

3.57

1.22

-6.99

-30.87

南天信息

000948

9.48

6.61

45.43

1.06

4.62

15.13

110.72

同方股份

600100

2.63

53.32

.78

.00

2.79

-4.77

26.72

永鼎股份

600105

2.54

1.69

71.91

.42

.63

1.87

27.49

宏图高科

600122

10.71

5.42

57.49

1.77

2.12

3.21

33.03

11.23

新大陆

000997

4.54

3.74

31.88

7.49

18.42

-6.27

方正科技

600601

3.16

43.95

1.40

4.67

-13.58

4.73

复旦复华

600624

4.44

3.68

49.44

.85

3.19

13.57

2.60

习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。

选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。

验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。

边远及少数民族聚居区的社会经济水平发展的指标数据:

地区

人均GDP

三产比重

人均消费

人口增长

文盲半文盲

内蒙古

5068

31.1

2141

8.23

15,83

广西

4076

34.2

2040

9.01

13.32

贵州

2342

29.8

1551

14.26

28.98

云南

4355

2059

12.1

25.48

西藏

3716

43.5

15.9

57.97

宁夏

4270

37.3

1947

13.08

25.56

新疆

6229

35.4

2745

12.81

11.44

甘肃

3456

32.8

1612

10..04

28.65

青海

4367

40.9

2047

14.48

42.92

数据来源:

《中国统计年鉴》(1998)。

5项指标的全国平均水平

μ0=(6212.0132.8729729.515.78)/

 

第3章

例3-1若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。

在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。

若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。

表3-1某市2001年城镇居民户主个人收入数据

X1职工标准工资收入X5单位得到的其他收入

X2职工奖金收入X6其他收入

X3职工津贴收入X7性别

X4其他工资性收入X8就业身份

X1

X2

X3

X4

X5

X6

X7

X8

540.00

0.0

6.00

国有

1137.00

125.00

96.00

109.00

812.00

集体

1236.00

300.00

270.00

102.00

318.00

1008.00

86.0

246.00

1723.00

419.00

400.00

122.00

312.00

1080.00

569.00

147.00

156.00

210.00

1326.00

148.00

1110.00

110.00

80.00

193.00

1012.00

88.00

298.00

79.00

278.00

1209.00

179.00

67.00

198.00

514.00

1101.00

215.00

201.00

39.00

146.00

477.00

例3-3

English

Norwegian

Danish

Dutch

German

French

One

En

en

een

ein

un

Two

To

to

twee

zwei

deux

Three

Tre

tre

drie

drei

trois

Four

Fire

fire

vier

quatre

Five

Fem

fem

vijf

funf

einq

Six

Seks

seks

zes

sechs

six

seven

Sju

syv

zeven

siebcn

sept

Eight

Ate

otte

acht

huit

Nine

Ni

ni

negen

neun

neuf

Ten

Ti

ti

tien

zehn

dix

Spanish

Italian

Polish

Hungarian

Finnish

Uno

uno

jeden

egy

yksi

Dos

due

dwa

ketto

kaksi

Tres

trzy

harom

kolme

cuatro

quattro

cztery

negy

neua

Cinco

cinque

piec

ot

viisi

Seix

sei

szesc

hat

kuusi

Siete

sette

siedem

het

seitseman

Ocho

otto

osiem

nyolc

kahdeksau

nueve

nove

dziewiec

kilenc

yhdeksan

Diez

dieci

dziesiec

tiz

kymmenen

例3-4

X1食品支出(元/人)X5交通和通讯支出(元/人)

X2衣着支出(元/人)X6娱乐、教育和文化服务支出(元/人)

X3家庭设备、用品及服务支出(元/人)X7居住支出(元/人)

X4医疗保健支出(元/人)X8杂项商品和服务支出(元/人)

辽宁

1772.14

568.25

298.66

352.20

307.21

490.83

364.28

202.50

浙江

2752.25

569.95

662.31

541.06

623.05

917.23

599.98

354.39

河南

1386.76

460.99

312.97

280.78

246.24

407.26

547.19

188.52

1552.77

517.16

402.03

272.44

265.29

563.10

302.27

251.41

1711.03

458.57

334.91

307.24

297.72

495.34

274.48

306.45

例3-5

x1人均粮食支出(元/人)x5人均衣着支出(元/人)

x2人均副食支出(元/人)x6人均日用杂品支出(元/人)

x3人均烟、酒、饮料支出(元/人)x7人均水电燃料支出(元/人)

x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)

x1

x2

x3

x4

x5

x6

x7

x8

北京

21.30

124.89

35.43

73.98

93.01

20.58

43.97

433.73

天津

21.50

122.39

29.08

51.64

55.04

11.30

54.88

288.13

河北

18.25

90.21

24.45

32.44

62.48

7.45

47.50

178.84

山西

21.84

66.38

18.05

31.32

74.48

8.19

34.97

177.45

内蒙古

21.37

67.08

20.28

35.27

81.07

10.94

39.46

182.20

辽宁

22.74

115.88

28.21

42.44

58.07

9.63

48.65

194.85

吉林

20.22

88.94

18.54

35.63

65.72

8.81

50.29

186.52

黑龙江

21.33

75.50

14.00

29.56

69.29

8.24

42.08

165.90

上海

21.13

168.69

40.81

70.12

74.32

15.46

50.90

422.74

江苏

18.61

122.51

27.07

42.50

63.47

36.14

240.92

浙江

19.96

142.24

43.33

50.74

101.77

12.92

53.44

394.55

安徽

19.61

107.13

32.85

35.77

61.34

7.53

34.60

142.23

福建

171.65

22.30

40.53

57.13

12.60

54.03

225.08

江西

18.75

104.68

15.55

35.61

51.80

11.18

36.27

142.72

山东

18.27

88.34

19.07

43.19

72.98

12.59

42.16

200.18

河南

73.18

18.01

29.38

64.51

8.91

38.14

155.45

湖北

18.76

102.67

21.87

30.47

64.33

11.99

42.14

168.17

湖南

20.25

104.45

20.72

38.15

62.98

12.67

39.16

213.56

广东

23.68

173.30

17.43

43.59

53.66

16.86

65.02

385.94

广西

18.70

131.35

11.69

32.06

41.54

10.84

42.77

178.51

海南

16.16

139.92

12.98

23.58

24.87

10.76

32.35

144.21

重庆

18.18

120.39

26.18

37.94

68.16

11.64

38.48

246.37

四川

18.53

109.95

21.49

33.04

50.98

10.88

33.96

183.85

贵州

18.33

92.43

25.38

32.19

56.32

38.57

144.82

云南

99.08

33.36

32.01

52.06

190.04

西藏

29.67

146.90

54.36

86.10

14.77

193.10

陕西

20.03

70.75

19.75

34.95

53.29

10.55

38.20

189.41

甘肃

18.68

72.74

23.72

38.69

62.41

9.65

35.26

170.12

青海

20.33

75.64

20.88

33.86

53.81

10.06

32.82

171.32

宁夏

70.24

18.67

36.71

61.75

10.08

40.26

165.22

新疆

21.03

78.55

14.35

34.33

64.98

9.83

33.87

161.67

第4章

[例4-1]判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(IrisData)。

鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。

这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。

该数据给出150个鸢尾花的萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)、花瓣宽(petalwidth)以及这些花分别属于的种类(Species)等共五个变量。

萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。

这里三种鸢尾花各有50个观测值。

数据格式如下图所示:

定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolour鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)四个变量作为解释变量。

使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。

分组变量(GroupingVariable)选择y,然后定义

的区域,最小值是1,最大值是3。

解释变量(Independents)选择sepal.length、sepal.width、petal.length和petal.width。

统计量(Statistics)选项中选择描述统计量Means,UnivariateANOVAs和Box’M,函数选择Fisher和非标准化函数,矩阵选择Within-groupscorrelation。

分类(Classify)选项中选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是50种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewiseresults),综合表(SummeryTable)和“留一个在外”(Leave-one-outclassifation)的验证原则,协方差矩阵选择Within-groups,作图选择Combined-groups。

保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。

如果采用逐步判别法,我们还可以选择判别的方法(Method)。

得到分析结果如下:

输出结果4-1

Discriminant

(1)

(2)

(3)

输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。

第1张表反映的是有效样本量及变量缺失的情况。

第2张表是各组变量的描述统计分析。

第3张表是对各组均值是否相等的检验。

由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 表格模板

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2