随机数学建模方法及其应用.docx

上传人:b****1 文档编号:13672261 上传时间:2023-06-16 格式:DOCX 页数:25 大小:38.15KB
下载 相关 举报
随机数学建模方法及其应用.docx_第1页
第1页 / 共25页
随机数学建模方法及其应用.docx_第2页
第2页 / 共25页
随机数学建模方法及其应用.docx_第3页
第3页 / 共25页
随机数学建模方法及其应用.docx_第4页
第4页 / 共25页
随机数学建模方法及其应用.docx_第5页
第5页 / 共25页
随机数学建模方法及其应用.docx_第6页
第6页 / 共25页
随机数学建模方法及其应用.docx_第7页
第7页 / 共25页
随机数学建模方法及其应用.docx_第8页
第8页 / 共25页
随机数学建模方法及其应用.docx_第9页
第9页 / 共25页
随机数学建模方法及其应用.docx_第10页
第10页 / 共25页
随机数学建模方法及其应用.docx_第11页
第11页 / 共25页
随机数学建模方法及其应用.docx_第12页
第12页 / 共25页
随机数学建模方法及其应用.docx_第13页
第13页 / 共25页
随机数学建模方法及其应用.docx_第14页
第14页 / 共25页
随机数学建模方法及其应用.docx_第15页
第15页 / 共25页
随机数学建模方法及其应用.docx_第16页
第16页 / 共25页
随机数学建模方法及其应用.docx_第17页
第17页 / 共25页
随机数学建模方法及其应用.docx_第18页
第18页 / 共25页
随机数学建模方法及其应用.docx_第19页
第19页 / 共25页
随机数学建模方法及其应用.docx_第20页
第20页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

随机数学建模方法及其应用.docx

《随机数学建模方法及其应用.docx》由会员分享,可在线阅读,更多相关《随机数学建模方法及其应用.docx(25页珍藏版)》请在冰点文库上搜索。

随机数学建模方法及其应用.docx

随机数学建模方法及其应用

TTAstandardizationoffice【TTA5AB-TTAK08-TTA2C】

 

随机数学建模方法及其应用

随机数学建模方法及其应用

学院:

数学与计算机科学学院

回归分析法概述

回归分析法是通过研究两个或两个以上变量之间的相关关系,运用数理统计方法从事物的抑制状况预测未来的一种信息研究定量方法。

优点:

首先它利用降维技术用少数几个综合变量来代替原始多个变量,综合变量集中了原始变量的大部分信息。

其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价。

再次它在应用上侧重于信息贡献影响力综合评价。

缺点:

是当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。

命名清晰性低。

案例分析

以某医院的病例调查为例,对多元线性回归的显着性判断进行说明。

某医院为了解病人对医院工作的满意程度、病人的年龄、病情的严重程度、病人的忧虑程度之间的关系随机调查该医院的10位病人,可得到如下表格。

年龄

病情程度

忧虑程度

满意度

50

51

48

36

46

57

40

48

66

41

44

70

28

43

89

49

54

36

42

50

46

45

48

54

52

62

26

29

50

77

步骤:

1、将数据导入spss

2、打开分析--回归---线性

3、依次打开界面的每个选项进行对应选择。

可得到以下结果。

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.960a

.922

.883

a.预测变量:

(常量),忧虑程度,年龄,病情程度。

b.因变量:

满意度

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

3

.001a

残差

6

总计

9

a.预测变量:

(常量),忧虑程度,年龄,病情程度。

b.因变量:

满意度

系数a

模型

非标准化系数

标准系数

B

标准误差

试用版

t

Sig.

1

(常量)

.000

年龄

.389

.024

病情程度

.799

.545

忧虑程度

.163

a.因变量:

满意度

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

10

残差

.000

10

标准预测值

.000

10

标准残差

.782

.000

.816

10

a.因变量:

满意度

由上表可以得出:

聚类分析法概述

聚类分析法是将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。

目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。

其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似

优点:

聚类分析模型的优点就是直观,结论形式简明。

缺点:

在样本量较大时,要获得聚类结论有一定困难。

由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

案例分析

某教育研究所根据相关数据欲对北京18个区县中职教育发展进行聚类研究。

包括每万人的中职在校生数、每万人的中职招生数、每万人的中职毕业生数、每万人的中职专任教师数、专任教师中本科以上学历者占的比例等。

数据表格如下

东城

156

53

45

15

701

5356

西城

119

42

31

13

552

6449

崇文

202

72

57

16

633

5357

宜武

176

57

31

17

584

6432

朝阳

221

77

45

17

553

6625

海淀

169

64

42

13

573

5840

丰台

166

66

48

15

465

5532

石景山

192

61

52

19

535

5695

门头湾

127

53

33

30

376

3904

房山

115

38

25

10

618

7020

昌平

232

80

66

19

491

5089

顺义

67

35

17

5

403

3056

通县

98

40

25

7

474

5559

大兴

205

76

67

16

616

4990

平谷

81

39

21

7

533

2518

怀柔

121

52

27

12

637

4149

密云

84

41

22

6

618

4376

延庆

78

31

23

5

424

4677

步骤为:

1、将数据导入spss

2、打开分析----分类---系统聚类

聚类表

群集组合

首次出现阶群集

群集1

群集2

系数

群集1

群集2

下一阶

1

2

13

.000

0

0

4

2

10

18

.000

0

0

4

3

5

7

.000

0

0

10

4

2

10

.000

1

2

12

5

8

9

.000

0

0

7

6

3

14

.000

0

0

15

7

6

8

.000

0

5

8

8

4

6

.000

0

7

10

9

1

12

.001

0

0

11

10

4

5

.001

8

3

12

11

1

17

.001

9

0

13

12

2

4

.002

4

10

14

13

1

16

.003

11

0

15

14

2

11

.004

12

0

16

15

1

3

.006

13

6

16

16

1

2

.017

15

14

17

17

1

15

.095

16

0

0

3、在聚类界面依次进行相应项目,进行勾选。

可得如下结果。

RescaledDistanceClusterCombine

CASE0510152025

LabelNum+---------+---------+---------+---------+---------+

西城2-+

通县13-+

房山10-+

延庆18-+

朝阳5-+

丰台7-+

石景山8-+-------+

门头湾9-+|

海淀6-+|

宜武4-++---------------------------------------+

昌平11-+||

崇文3-+-+||

大兴14-+|||

东城1-++-----+|

顺义12-+||

密云17-+-+|

怀柔16-+|

平谷15-------------------------------------------------+

判别分析法概述

判别分析又称"分辨法",是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。

优点:

用这种方法得出的数据比较接近实际;另外,采用这种方法,便于确定分配给各销售人员的销售任务,发挥其积极性,他们努力完成各自的销售任务。

缺点:

由于受各种因素的影响,就比如销售人员的预测也会出现偏差,对销售人员的预测往往需要进行修正。

案例分析

为研究1991年中国城镇居民月平均收入状况,现将30个省、市、自治区为为三类。

试根据已有数据,研究广东、广西分别属于哪个收入类别?

数据如下。

1

北京

2

天津

3

河北

11

12

4

上海

31

5

山东

6

湖北

7

广西

8

海南

9

四川

10

云南

11

新疆

1

山西

2

内蒙古

3

吉林

4

黑龙江

5

江西

6

河南

7

贵州

8

陕西

9

甘肃

10

青海

11

宁夏

1

辽宁

2

江苏

3

浙江

13

4

安徽

5

福建

6

湖南

124

1

广东

114

2

西藏

0

分别为:

人均生活费收入、人均各种奖金、超额工资、人均国有经济单位职工工资、人均各种津贴、人均来源国有经济单位标准工资、人均工作单位得到的其他收入、人均集体所有制工资收入、个体劳动者收入、人均集体所有制职工标准工资。

步骤为:

1、将数据导入到spss中

2、打开分析---分类---判别

3、在判别界面上进行相应操作,并选定。

可得如下结果。

组统计量

组均值的均等性的检验

Wilks的Lambda

F

df1

df2

Sig.

V3

.916

.368

2

8

.703

V4

.915

.374

2

8

.699

V5

.976

.099

2

8

.907

V6

.920

.349

2

8

.715

V7

.973

.109

2

8

.898

V8

.889

.501

2

8

.624

V9

.866

.619

2

8

.562

V10

.983

.068

2

8

.935

V11

.864

.631

2

8

.556

主成分分析概述

主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。

优点:

1、可消除评估指标之间的相关影响。

因为主成分分析法在对原始数据指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越高,主成分分析效果越好。

2、可减少指标选择的工作量,对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析法由于可以消除这种相关影响,所以在指标选择上相对容易些。

3、主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前面方差较大的几个主成分来代表原变量,从而减少了计算工作量。

用主成分分析法作综合评估时,由于选择的原则是累计贡献率≥85%,不至于因为节省了工作量却把关键指标漏掉而影响评估结果。

缺点:

1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。

2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。

因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。

3、当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。

案例分析

地区

GDP

人均GDP

农业增加值

工业增加值

第三产业增加值

固定资产投资

基本建设投资

社会消费品零售总额

海关出口总额

地方财政收入

辽宁

13000

山东

10550

11643

河北

9047

天津

22068

江苏

10636

14397

上海

40627

浙江

7670

16570

福建

4682

13510

广东

11770

15030

广西

5062

367

步骤:

1、将数据导入spss

2、打开分析---降维---因子分析

3、对应界面完成相应操作,并勾选。

可得结果如下

描述统计量

均值

标准差

分析N

GDP

10

人均GDP

10

农业增加值

10

工业增加值

10

第三产业增加值

10

固定资产投资

10

基本建设投资

10

社会消费品零售总额

10

海关出口总额

10

地方财政收入

10

相关矩阵a

GDP

人均GDP

农业增加值

工业增加值

第三产业增加值

相关

GDP

.967

.979

人均GDP

.113

.074

农业增加值

工业增加值

.967

.113

.985

第三产业增加值

.979

.074

.985

固定资产投资

.923

.214

.963

.973

基本建设投资

.922

.093

.939

.940

社会消费品零售总额

.941

.013

.935

.962

海关出口总额

.637

.081

.705

.714

地方财政收入

.826

.273

.898

.913

a.此矩阵不是正定矩阵。

相关矩阵a

固定资产投资

基本建设投资

社会消费品零售总额

相关

GDP

.923

.922

.941

人均GDP

.214

.093

农业增加值

.013

工业增加值

.963

.939

.935

第三产业增加值

.973

.940

.962

固定资产投资

.971

.937

基本建设投资

.971

.897

社会消费品零售总额

.937

.897

海关出口总额

.717

.624

.836

地方财政收入

.934

.848

.929

a.此矩阵不是正定矩阵。

相关矩阵a

海关出口总额

地方财政收入

相关

GDP

.637

.826

人均GDP

.081

.273

农业增加值

工业增加值

.705

.898

第三产业增加值

.714

.913

固定资产投资

.717

.934

基本建设投资

.624

.848

社会消费品零售总额

.836

.929

海关出口总额

.882

地方财政收入

.882

a.此矩阵不是正定矩阵。

公因子方差

初始

提取

GDP

.938

人均GDP

.691

农业增加值

.470

工业增加值

.957

第三产业增加值

.978

固定资产投资

.970

基本建设投资

.897

社会消费品零售总额

.985

海关出口总额

.642

地方财政收入

.927

提取方法:

主成份分析。

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

2

3

.877

4

.547

5

.085

.854

6

.021

.211

7

.012

.119

8

.002

.018

9

.001

.012

10

提取方法:

主成份分析。

成份矩阵a

成份

1

2

GDP

.949

.195

人均GDP

.112

农业增加值

.677

工业增加值

.978

第三产业增加值

.986

.070

固定资产投资

.983

基本建设投资

.947

社会消费品零售总额

.977

.176

海关出口总额

.800

地方财政收入

.954

提取方法:

主成分分析法。

a.已提取了2个成份。

因子分析法概述

因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。

应用范围为:

解决共线型问题、评价问卷的结构效度、寻找变量间潜在的结构、内在结构证实

案例分析

下表资料为25位健康人的7项生化检验结果,7项生化检验指标依次命名为X1到X7,数据如下。

X1

X2

X3

X4

X5

X6

X7

7

1

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 文学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2