美国数学建模竞赛论文C题论文Word格式文档下载.docx

上传人:b****1 文档编号:371472 上传时间:2023-04-28 格式:DOCX 页数:31 大小:319.19KB
下载 相关 举报
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第1页
第1页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第2页
第2页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第3页
第3页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第4页
第4页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第5页
第5页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第6页
第6页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第7页
第7页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第8页
第8页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第9页
第9页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第10页
第10页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第11页
第11页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第12页
第12页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第13页
第13页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第14页
第14页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第15页
第15页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第16页
第16页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第17页
第17页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第18页
第18页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第19页
第19页 / 共31页
美国数学建模竞赛论文C题论文Word格式文档下载.docx_第20页
第20页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

美国数学建模竞赛论文C题论文Word格式文档下载.docx

《美国数学建模竞赛论文C题论文Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《美国数学建模竞赛论文C题论文Word格式文档下载.docx(31页珍藏版)》请在冰点文库上搜索。

美国数学建模竞赛论文C题论文Word格式文档下载.docx

标准化后的健康值

相关系数矩阵

Ci

Ki

B,Y

a

聚类系数

节点i的邻接点

数据矩阵

健康指数的临界值

注:

部分未说明的符号在模型会给与介绍。

四、问题分析

根据对题目的分析,我们知道题目要求我们考虑地球上各系统间的交叉影响的复杂性及地区条件和全球系统之间的影响,建立一个动态的全球网络模型,明确节点的实体和节点间的链接特性,根据地区条件变化引起全球变化提供预警,并能预测未来地球健康状况的变化,为政策制定者提供有效的政策。

针对问题,以国家为节点,根据生态学选取地球健康因子,在世界银行数据库中查得所需的数据。

具体分析思路如下:

(1)根据所查的数据求出各个节点及世界的健康指数。

可以通过主成分分析法对所取20年的数据进行综合评价;

(2)接着,求解各节点间的影响及内部的相互作用。

在主成分分析的基础上,因为数据量较大,在21个国家中挑选出8个国家来构成“小世界”作为真实世界的模拟。

对于选出来的8个国家,将他们构成有向复杂网络来考虑各节点间的影响及内部的相互作用。

(3)对未来健康状况的预测。

根据全球1991年到2010年的健康指数,以20年的数据为基础,采用GM(1,1)进行预测,并提出预警情况。

五、模型的建立与求解

5.1节点和指标的选取

(1)节点的选取

考虑地理位置和国家发展状况,选取了21个典型的国家,这21个国家可以代表全球。

选取的21个国家:

Argentina,Australia,Brazil,Canada,China,Egypt,ArabRep.,France,Germany,Iran,IslamicRep.,Israel,Italy,Japan,Kazakhstan,Kenya,Morocco,NewZealand,RussianFederation,Saudi,Arabia,SouthAfricaUnited,Kingdom,UnitedStates。

(2)指标的选取[1,2]

地球是一个大生态系统,我们根据文献[3]选取了11个地球健康的指标,如下表所示:

表1地球健康指标

地球健康

社会因素

城镇人口比重(%)

人均耕地面积(公顷)

高等院校入学率(%)

经济因素

人均GDP(美元)

每千美元的能源消耗量(千克石油当量)

环境因素

CO2排放量(人均公吨数)

颗粒污染程度(每立方米微克)

人均能源使用量(千克石油当量)

人的因素

人口密度(每平方公里)

人口增长(%)

五岁以下婴儿死亡率(%)

选取21个国家11个指标的时间区间:

[1991-2010]年;

数据的来源:

世界银行数据库[4]

5.2主成分分析模型的建立与求解

5.2.1主成分分析法的步骤

1)对原始数据进行标准化处理

假设进行主成分分析的指标变量有m个:

,共有n个评价对象,第i个评价对象的第j个指标的取值为

将各指标值

转换成标准化指标

其中,

即,

为第j个指标的样本均值和样本标准差。

对应地,称

为标准化指标变量。

2)计算相关系数矩阵R

式中

=1,

=

是第i个指标与第j个指标的相关系数。

3)计算特征值和特征向量

计算相关系数矩阵R的特征值

,及对应的特征向量

,其中

,由特征向量组成m个新的指标变量

式中,

是第1主成分,

是第2主成分,…,

是第m主成分。

4)选择p(

)个主成分,计算综合评价值

①计算特征值

的信息贡献率和累积贡献率。

主成分的信息贡献率;

为主成分

的累积贡献率,当

接近于1时,则选择前p个指标变量

作为p个主成分,代替原来m个指标变量,从而可对p个主成分进行综合分析。

②计算综合得分

定义:

Z为健康指数,表示健康状况的综合评价值

5.2.2模型的求解

以2000年的数据为例,我们选取5个主成分即令p=5,

利用MATLAB软件对11个评价指标进行主成分分析,相关系数矩阵的前几个特征根及其贡献率如表2。

表2主成分分析结果

序号

特征根

贡献率

累积贡献率

1

5.2218

47.4705

2

2.1995

19.9958

67.4663

3

1.2675

11.5227

78.9890

4

0.7369

6.6991

85.6880

5

0.6986

6.3505

92.0385

6

0.3396

3.0873

95.1258

可以看出,前四个特征根的累计贡献率就达到85%以上,主成分分析效果很好。

下面我们选取五个主成分(累计贡献率就达到92%)进行综合评价。

前五个特征根对应的特征向量见表3。

表3标准化变量的前4个主成分对应的特征向量

第1特征向量

第2特征向量

第3特征向量

第4特征向量

第5特征向量

0.3775

0.3566

0.3763

-0.1293

-0.2234

-0.2237

-0.0496

0.2021

0.4985

-0.0598

0.0420

0.2146

0.1964

-0.2126

0.5592

0.3196

-0.4443

0.3221

0.4191

-0.0334

0.1640

-0.0233

-0.0179

-0.3379

-0.6483

-0.2654

0.5122

-0.0411

0.4827

-0.2919

7

-0.0768

0.1891

-0.3317

0.2333

0.0738

8

0.0144

-0.3248

-0.1567

0.0767

0.2092

9

0.4409

0.4558

-0.1574

0.1030

0.2607

10

0.4813

-0.0075

0.2345

0.2786

0.0302

11

-0.4173

0.1223

0.6774

-0.1347

0.0955

竖列的1,2…,11表示标准化后的11个数据,即

,…,

由此得到五个主成分:

从主成分的系数可以看出,第一主成分主要反映了人均GDP、人口密度、高等院校入学率、人均耕地面积的信息;

第二主成分主要反映了人均GDP、每千美元的能源消耗量、CO2排放量、人口增长、人口密度;

第三主成分主要反映了人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率、人均耕地面积;

第四主成分主要反映了城镇人口比重、每千美元的能源消耗量、颗粒污染程度、CO2排放量;

第五主成分主要反映了人均能源使用量和颗粒污染程度。

综上可以看出人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率的影响相对较大一些。

把各节点的原始11个指标的标准化数据代入五个主成分的表达式,就可以得到各地区的五个主成分值。

分别以五个主成分的贡献率为权重,构建主成分综合评价模型:

(1)

把各节点的五个主成分值代入式

(1),可以得到各地区高教发展水平的综合评价值以及排序结果如表4

表42000年的21个国家和世界的健康指数

节点

USA

AUS

CAN

NZL

RUS

JPN

排名

2.054

2.039

1.968

0.724

0.539

0.529

GBR

FRA

DEU

ISR

SAU

ITA

12

0.495

0.429

0.418

0.291

0.195

0.075

ARG

KAZ

ZAF

BRA

IRN

WLD

13

14

15

16

17

18

-0.075

-0.094

-0.558

-0.788

-0.85685

-1.11022

MAR

EGY

CHN

KEN

19

20

21

22

-1.34431

-1.48728

-1.49224

-1.94967

上述的USA等为各节点的缩写。

由表4以及附录中表5的数据可以看出美国、澳大利亚、加拿大的健康指数在20年内都很高,说明这几个国家的健康状况较好;

Morocco、EgyptArabRep.China、Kenya等国家的健康指数在20年后都很低,说明这几个国家的健康状况较差。

同时可以世界平均水平的健康指数也较低,说明地球面临严峻的健康问题。

运用同样的方法,可以求出1991-2010的各节点的综合评价,所得的综合值Z进行如下标准化:

标准化后的1991-2010年的21个国家和世界的健康指数见附录。

5.3有向复杂网络模型的建立与求解

针对上文已经得到的21个国家的生态健康指数值,考虑在同一个地球生物圈内各国的生态健康是相互作用的,不能独立于周边的国家的影响,而且随着全球化进程的不断加快,全球间的各个国家势必会联系越来越频繁。

我们在考虑地球生态健康的时候,将各个国家看成一个个节点,不同节点由网络边连接起来,构成整体的生态系统网络。

在整个生态系统大网络中各个节点间是否作用,或作用的强弱程度我们是通过对选取节点的健康值进行逐步回归得到的。

本文运用逐步回归来分析来确定有向复杂网络的边和对应权重。

由于涉及国家数目过多,根据地理特性分别在各大洲共选取8个国家:

澳大利亚、巴西、中国、日本、俄罗斯联邦、南非、英国、美国。

依次将其中一个国家的生态健康值当做y值,其余各国指标为x值来进行逐步回归观察各国家节点在网络中是否关联及相应权重。

5.3.1逐步回归

逐步回归的基本思想是:

对全部因子按其对y影响程度大小(偏回归平方的大小),从大到小地依次逐个地引入回归方程,并随时对回归方程当时所含的全部变量进行检验,看其是否仍然显著,如不显著就将其剔除,知道回归方程中所含的所有变量对y的作用都显著是,才考虑引入新的变量。

再在剩下的未选因子中,选出对y作用最大者,检验其显著性,显著着,引入方程,不显著,则不引入。

直到最后再没有显著因子可以引入,也没有不显著的变量需要剔除为止。

逐步回归分析时在考虑的全部自变量中按其对y的贡献程度大小,由大到小地逐个引入回归方程,而对那些对y作用不显著的变量可能是中不被引入回归方程。

另外,已被引入回归方程的变量在引入新变量进行F检验后失去重要性时,需要从回归方程中剔除出去。

逐步回归算法步骤:

Step1计算变量均值:

差平方和:

记各自的标准化变量为:

Step2计算

的相关系数矩阵

Step3设已经选上了

个变量:

互不相同,

经过变换后为:

逐一计算标准化变量

的偏回归平方和:

记:

作F检验:

对给定的显著性水平

,拒绝域为:

Step4转到Step3循环,直至最终选上了

个变量

,且

则对应的回归方程为:

通过代数运算可得:

逐步回归是用Matlab统计工具箱中的命令stepwise,它提供了一个交互式画面,通过这个工具你可以自由地选择变量,进行统计分析,其方法通常为:

stepwise(x,y,inmodel,alpha)

其中x是自变量数据,y是因变量数据,分别为n×

m和n×

1矩阵,inmodel是矩阵x的列数的指标,给出初始模型中包括的子集(缺省时设定为空),alpha为显著性水平。

StepwiseRegression窗口,显示回归系数及其置信区间,和其它一些统计量的信息。

绿色表明在模型中的变量,红色表明从模型中移去的变量。

在这个窗口中有Export按钮,点击Export产生一个菜单,表明了要传送给Matlab工作区的参数,它们给出了统计计算的一些结果。

下面以美国的指标为y值,其他国家的指标为x值进行逐步回归的结果:

,由此认为美国和巴西,中国,日本,俄罗斯之间的节点存在边,各边权重分别为-0.4606,-0.4921,0.5677,0.191.具体运算界面见图1

图1逐步回归结果图(USA)

同样方法可以得到其他各国节点在网络中的边和权重。

各国数据如表6

表6网络中国家节点边和权重

 

USA

常数项

-0.4606

-0.4921

0.5677

0.191

0.5118

-0.7831

-0.5625

2.3883

-0.4973

-0.3407

0.3206

-0.4133

-0.6625

0.718

0.3529

-0.6411

-0.8937

-0.4951

0.7807

0.8548

-0.5061

0.4372

0.6933

0.2677

-0.4953

0.2168

-0.6611

0.3652

2.133

-0.9761

0.4575

0.2597

-1.3095

-1.5355

-0.11

-0.6519

0.364

-0.4864

-0.6103

经过matlab运算后的逐步回归结果整理后得到有向复杂网络图如图2,其中各节点的作用的方向和作用权重如图:

图2八国家的复杂网络图及权重

5.3.2有向复杂网络模型计算分析

随着复杂网络研究的不断深入,在原有的基于无权网络的ER随机图模型、WS小世界模型和无标度网络模型BA模型基础上,文献[9]给出了一个由边和节点权值驱动网络动态演化的BBV模型。

所谓的BBV网络模型[6,7]是2004年BarratBarthelemy和vesPignani提出的一个无向加权的网络演化模型。

首先定义一个有向加权网络:

设图DWG=(V,E)表示一个复杂网络。

其中V表示节点集,E表示边集。

总节点数一记为N,边数记为M,

E中每条边都有V中的一对点与之相对应。

任意两点i和j对应的边(i,j)和(j,i)不同。

入强度:

出强度:

其中所有Vi的所有邻接点Aij表示i和j之间有连接的边,且边的指向性是节点i指向节点j。

有向复杂网络的平均最短路径长度:

平均距离定义:

实际中网络的平均最短距离:

在有向加权网络中,i的度有出入度之分。

因此,需要分别考虑邻接点与i之间的关系。

设节点i的邻接点为Ki,其中Kin,表示Ki作为源节点与i相连的节点,Kout表示Ki,作为目的节点与i相连的节点。

在有向加权网络的分析中,为了更好的统一属性,主要考虑以i为源节点的相邻节点。

设Ki个节点之间的实际边数为Ei,则一记节点i的聚类系数为Ci:

网络的聚类系数记为:

各表现网络节点的基本参数值,入强度,出强度,聚类系数,最短路径和权值的数据如表7所示:

表7网络节点的基本参数值

入强度

出强度

最短路径

权值

美国

1.7114

1.9405

0.125

0.100027

澳大利亚

1.3456

0.6053

0.71429

0.078647

巴西

1.1586

0.4606

0.067717

中国

3.2682

3.5123

0.19642857

0.191018

日本

3.2721

3.0889

0.191246

俄罗斯

1.7384

2.0928

0.16071429

0.101605

南非

3.0028

1.9299

0.14285714

0.175506

英国

1.6123

3.459

0.094235

总计

17.1094

17.0893

2.39286571

89

其中本复杂网络的实际网络平均最短距离:

显然,

的值是较小的,平均各节点仅需要1.5893的最短距离就可以建立联系,这点体现了复杂网络里的“小世界”特性。

网络聚类系数:

值在[0,1]间,更接近与0,说明网络的的聚集程度较差,凝聚力较差。

所有国家节点中,中国和日本的权值最大,对于整个系统健康状况有较大的影响。

原因可能是这两个国家分别在生活用品和高科技产品有很重要的地位和交流的中心。

对有向复杂网络的基本参数的讨论后,决定通过网络边上的权值来得到网络中各节点的权值。

接下来用网络反馈加权计算八个国家组成的小生态系统的健康来和没有通过网络反馈而直接得到的综合值进行比较。

因此,通过网络可以得到八个国家组成的小世界生态健康指标的总值:

表8网络加权得分和直接综合得分的比较

时间

网络反馈加权得分

直接综合得分

1991

0.364447184

0.229314502

2001

0.397829466

0.259401833

1992

0.352459125

0.21578088

2002

0.40408486

0.255952213

1993

0.37245721

0.252210245

2003

0.39174483

0.244295838

1994

0.373917607

0.252173728

2004

0.375449543

0.221100739

1995

0.3695162

0.251945436

2005

0.382170867

0.234912051

1996

0.368170097

0.237820212

2006

0.340898702

0.207891795

1997

0.385066569

0.262875135

2007

0.377473801

0.237697352

1998

0.386963668

0.287174438

2008

0.348495981

0.222164283

1999

0.414326766

0.293726934

2009

0.360717995

0.237959847

2000

0.413090751

0.284997161

2010

0.379222361

0.237210636

图3网络预测值与直接加权值的对比图4修正后模型与直接预测模型的对比

由两者的对比可以观察出网络加权健康得分教直接预测得分高,根据两者特性和趋势对网络加权计算健康的分的模型做如下修正:

修正模型后与直接预测值比较:

见上图4

通过图像可以看出二者总体的趋势和得分差距并不大,可以看出两种综合评价体系是相对合理的。

由于网络加权评价模型考虑了网络中不同节点影响和反馈,因此相信有向复杂网络模型得到的评级得分时更具说明性的,在条件容许的条件下,把全球200多个国家全作为网络节点,运用有向复杂网络来考虑他们间的影响和联系来判断地球总体生态健康水平会更合理可靠。

本模型有很大的推广和扩大价值。

5.3

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2