美国数学建模竞赛论文C题论文.docx

上传人:b****1 文档编号:23142963 上传时间:2023-05-08 格式:DOCX 页数:31 大小:319.19KB
下载 相关 举报
美国数学建模竞赛论文C题论文.docx_第1页
第1页 / 共31页
美国数学建模竞赛论文C题论文.docx_第2页
第2页 / 共31页
美国数学建模竞赛论文C题论文.docx_第3页
第3页 / 共31页
美国数学建模竞赛论文C题论文.docx_第4页
第4页 / 共31页
美国数学建模竞赛论文C题论文.docx_第5页
第5页 / 共31页
点击查看更多>>
下载资源
资源描述

美国数学建模竞赛论文C题论文.docx

《美国数学建模竞赛论文C题论文.docx》由会员分享,可在线阅读,更多相关《美国数学建模竞赛论文C题论文.docx(31页珍藏版)》请在冰豆网上搜索。

美国数学建模竞赛论文C题论文.docx

美国数学建模竞赛论文C题论文

基于主成分-有向复杂网络的地球健康的评价及动态预测

摘要

地球是一个庞大而复杂的生态系统,评价并预测其健康状况一直是一个难题。

本文建立了分析各国家(节点)健康状况的主成分分析模型;基于生态系统的复杂性,进一步构建了一个反映各节点间交互影响的有向复杂网络模型;进而采用灰色预测模型对地球健康状况进行动态预测。

计算每个节点的健康指数。

因为地球上的国家较多和地球健康指数影响指标较多,本文选取21个国家作为分析地球的节点、11个地球健康指标。

采用主成分分析法对21个节点以及全球的11个指标进行综合分析,把11个指标抽象成5个主成分进行健康指数的求解。

我们以2000年的进行验证,结果显示五个主成分的累积贡献率高达92%,结果可靠。

我们同时对各个节点的综合值Z(健康指数)进行排名,排名靠前的是美国、澳大利亚、加拿大等发达国家,排名靠后的是Morocco、EgyptArabRep.China、Kenya等发展中国家且生态保护较差的国家。

分析节点间的交互影响。

建立有向复杂网络来考虑各节点间的相互影响,选取8个典型国家来构成类似生物圈的“小世界”,用8个国家节点的健康指数进行逐步回归来确定网络的边和权重。

在考察网络的基本特征参数后,通过边的权重来求得各节点的权重值。

最后我们用修正后的网络加权模型和主成分分析模型结果对比,二者相互验证,说明模型的合理性。

最后将模型推广到地球生态系统。

未来地球健康状况的动态预测。

我采用灰色预测中的GM(1,1)模型对世界的健康指数进行10年的动态预测,预测结果的相对误差小于5%,预测精度较高。

预测的十年结果见表11。

对于模型的预警,我们通过给定健康指数的最低值a作为临界点,把GM(1,1)预测的结果与a比较,小于a则就警报。

对于a的确定可以查找本文中11个指标的限定,通过限定值确定a的大小。

对于政策的影响,我们选取中国和世界的人口增长率为对象进行了分析,证明政策对地球生态有一定的潜在影响。

 

关键词健康指数有向复杂网络主成分分析逐步回归动态预测

 

一、问题重述

本题目要求建立一个全球网络,该网络一方面能建立一个全球模型来改进生物预测,这个模型要能反映由于地球上各系统间的交叉影响而带来的复杂性,以及地区条件和全球系统之间的相互影响,指明如何有效使用生态系统管理来防止或减少这些迫近的变化,并为政策制定者提供建议。

同时,尽管许多警示性的信号已经出现,但没人知道地球是否已经在全球范围内逼近了临界点,以及这样一个极端的状态是否是不可避免的,题目要求我们建立的模型能预测生态健康的临界点,并为阻止达到这个临界点提供意见。

要求1:

通过确定影响地球健康某一方面的本土因素,即网络节点,分析其关系和属性,通过恰当的方式将这些节点连起来,在此基础上建立一个动态的全球网络模型。

明确定义模型中的所有要素并且解释你在建模过程中界定网络建构考量因素、节点实体和链接特性的科学依据。

要求2:

要求预测未来的地球健康,并通过数据进行验证、评估。

同时注意模型中是否有人为因素,该模型是否能预测地球状态的变化或临界点。

还要求出本地发生变化时引起的全球的变化。

要求3:

所建立的模型能识别网络中的关键点,并且在节点缺失时能感知,有一定的灵敏度,能在全球的生态健康方面发挥预警作用。

要求4:

拟定一篇20页的报告(不包括总结页)来解释所建的模型与其应用前景。

确保指出模型的优点和缺点。

二、模型假设

1所查到的数据真实可靠。

2所使用的11个因素涵盖了影响生态系统健康的所有方面。

3在预测的时间段内,世界不会发生极大影响生态系统健康的突发性事件。

4对于部分缺失的数据,所填补是公平合理的,不影响总体。

5模型基于的规则是完全公平的。

6模型建立的过程中所有选择的国家都是具有代表性的,可以带表整体的特性。

三、符号说明

符号

含义

Z

健康指数

标准化后指标值

指标的取值

p

R

主成分数

标准化后的健康值

相关系数矩阵

Ci

Ki

B,Y

a

聚类系数

节点i的邻接点

数据矩阵

健康指数的临界值

注:

部分未说明的符号在模型会给与介绍。

四、问题分析

根据对题目的分析,我们知道题目要求我们考虑地球上各系统间的交叉影响的复杂性及地区条件和全球系统之间的影响,建立一个动态的全球网络模型,明确节点的实体和节点间的链接特性,根据地区条件变化引起全球变化提供预警,并能预测未来地球健康状况的变化,为政策制定者提供有效的政策。

针对问题,以国家为节点,根据生态学选取地球健康因子,在世界银行数据库中查得所需的数据。

具体分析思路如下:

(1)根据所查的数据求出各个节点及世界的健康指数。

可以通过主成分分析法对所取20年的数据进行综合评价;

(2)接着,求解各节点间的影响及内部的相互作用。

在主成分分析的基础上,因为数据量较大,在21个国家中挑选出8个国家来构成“小世界”作为真实世界的模拟。

对于选出来的8个国家,将他们构成有向复杂网络来考虑各节点间的影响及内部的相互作用。

(3)对未来健康状况的预测。

根据全球1991年到2010年的健康指数,以20年的数据为基础,采用GM(1,1)进行预测,并提出预警情况。

五、模型的建立与求解

5.1节点和指标的选取

(1)节点的选取

考虑地理位置和国家发展状况,选取了21个典型的国家,这21个国家可以代表全球。

选取的21个国家:

Argentina,Australia,Brazil,Canada,China,Egypt,ArabRep.,France,Germany,Iran,IslamicRep.,Israel,Italy,Japan,Kazakhstan,Kenya,Morocco,NewZealand,RussianFederation,Saudi,Arabia,SouthAfricaUnited,Kingdom,UnitedStates。

(2)指标的选取[1,2]

地球是一个大生态系统,我们根据文献[3]选取了11个地球健康的指标,如下表所示:

表1地球健康指标

 

地球健康

社会因素

城镇人口比重(%)

人均耕地面积(公顷)

高等院校入学率(%)

经济因素

人均GDP(美元)

每千美元的能源消耗量(千克石油当量)

环境因素

CO2排放量(人均公吨数)

颗粒污染程度(每立方米微克)

人均能源使用量(千克石油当量)

人的因素

人口密度(每平方公里)

人口增长(%)

五岁以下婴儿死亡率(%)

选取21个国家11个指标的时间区间:

[1991-2010]年;数据的来源:

世界银行数据库[4]

5.2主成分分析模型的建立与求解

5.2.1主成分分析法的步骤

1)对原始数据进行标准化处理

假设进行主成分分析的指标变量有m个:

,共有n个评价对象,第i个评价对象的第j个指标的取值为

将各指标值

转换成标准化指标

其中,

即,

为第j个指标的样本均值和样本标准差。

对应地,称

为标准化指标变量。

2)计算相关系数矩阵R

相关系数矩阵

式中

=1,

=

是第i个指标与第j个指标的相关系数。

3)计算特征值和特征向量

计算相关系数矩阵R的特征值

,及对应的特征向量

,其中

,由特征向量组成m个新的指标变量

式中,

是第1主成分,

是第2主成分,…,

是第m主成分。

4)选择p(

)个主成分,计算综合评价值

①计算特征值

的信息贡献率和累积贡献率。

主成分的信息贡献率;称

为主成分

的累积贡献率,当

接近于1时,则选择前p个指标变量

作为p个主成分,代替原来m个指标变量,从而可对p个主成分进行综合分析。

②计算综合得分

定义:

Z为健康指数,表示健康状况的综合评价值

5.2.2模型的求解

以2000年的数据为例,我们选取5个主成分即令p=5,

利用MATLAB软件对11个评价指标进行主成分分析,相关系数矩阵的前几个特征根及其贡献率如表2。

表2主成分分析结果

序号

特征根

贡献率

累积贡献率

1

5.2218

47.4705

47.4705

2

2.1995

19.9958

67.4663

3

1.2675

11.5227

78.9890

4

0.7369

6.6991

85.6880

5

0.6986

6.3505

92.0385

6

0.3396

3.0873

95.1258

可以看出,前四个特征根的累计贡献率就达到85%以上,主成分分析效果很好。

下面我们选取五个主成分(累计贡献率就达到92%)进行综合评价。

前五个特征根对应的特征向量见表3。

表3标准化变量的前4个主成分对应的特征向量

第1特征向量

第2特征向量

第3特征向量

第4特征向量

第5特征向量

1

0.3775

0.3566

0.3763

-0.1293

-0.2234

2

-0.2237

-0.0496

0.2021

0.4985

-0.0598

3

0.0420

0.2146

0.1964

-0.2126

0.5592

4

0.3196

-0.4443

0.3221

0.4191

-0.0334

5

0.1640

-0.0233

-0.0179

-0.3379

-0.6483

6

-0.2654

0.5122

-0.0411

0.4827

-0.2919

7

-0.0768

0.1891

-0.3317

0.2333

0.0738

8

0.0144

-0.3248

-0.1567

0.0767

0.2092

9

0.4409

0.4558

-0.1574

0.1030

0.2607

10

0.4813

-0.0075

0.2345

0.2786

0.0302

11

-0.4173

0.1223

0.6774

-0.1347

0.0955

注:

竖列的1,2…,11表示标准化后的11个数据,即

,…,

由此得到五个主成分:

从主成分的系数可以看出,第一主成分主要反映了人均GDP、人口密度、高等院校入学率、人均耕地面积的信息;第二主成分主要反映了人均GDP、每千美元的能源消耗量、CO2排放量、人口增长、人口密度;第三主成分主要反映了人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率、人均耕地面积;第四主成分主要反映了城镇人口比重、每千美元的能源消耗量、颗粒污染程度、CO2排放量;第五主成分主要反映了人均能源使用量和颗粒污染程度。

综上可以看出人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率的影响相对较大一些。

把各节点的原始11个指标的标准化数据代入五个主成分的表达式,就可以得到各地区的五个主成分值。

分别以五个主成分的贡献率为权重,构建主成分综合评价模型:

(1)

把各节点的五个主成分值代入式

(1),可以得到各地区高教发展水平的综合评价值以及排序结果如表4

表42000年的21个国家和世界的健康指数

节点

USA

AUS

CAN

NZL

RUS

JPN

排名

1

2

3

4

5

6

Z

2.054

2.039

1.968

0.724

0.539

0.529

节点

GBR

FRA

DEU

ISR

SAU

ITA

排名

7

8

9

10

11

12

Z

0.495

0.429

0.418

0.291

0.195

0.075

节点

ARG

KAZ

ZAF

BRA

IRN

WLD

排名

13

14

15

16

17

18

Z

-0.075

-0.094

-0.558

-0.788

-0.85685

-1.11022

节点

MAR

EGY

CHN

KEN

排名

19

20

21

22

Z

-1.34431

-1.48728

-1.49224

-1.94967

注:

上述的USA等为各节点的缩写。

由表4以及附录中表5的数据可以看出美国、澳大利亚、加拿大的健康指数在20年内都很高,说明这几个国家的健康状况较好;Morocco、EgyptArabRep.China、Kenya等国家的健康指数在20年后都很低,说明这几个国家的健康状况较差。

同时可以世界平均水平的健康指数也较低,说明地球面临严峻的健康问题。

运用同样的方法,可以求出1991-2010的各节点的综合评价,所得的综合值Z进行如下标准化:

标准化后的1991-2010年的21个国家和世界的健康指数见附录。

5.3有向复杂网络模型的建立与求解

针对上文已经得到的21个国家的生态健康指数值,考虑在同一个地球生物圈内各国的生态健康是相互作用的,不能独立于周边的国家的影响,而且随着全球化进程的不断加快,全球间的各个国家势必会联系越来越频繁。

我们在考虑地球生态健康的时候,将各个国家看成一个个节点,不同节点由网络边连接起来,构成整体的生态系统网络。

在整个生态系统大网络中各个节点间是否作用,或作用的强弱程度我们是通过对选取节点的健康值进行逐步回归得到的。

本文运用逐步回归来分析来确定有向复杂网络的边和对应权重。

由于涉及国家数目过多,根据地理特性分别在各大洲共选取8个国家:

澳大利亚、巴西、中国、日本、俄罗斯联邦、南非、英国、美国。

依次将其中一个国家的生态健康值当做y值,其余各国指标为x值来进行逐步回归观察各国家节点在网络中是否关联及相应权重。

5.3.1逐步回归

逐步回归的基本思想是:

对全部因子按其对y影响程度大小(偏回归平方的大小),从大到小地依次逐个地引入回归方程,并随时对回归方程当时所含的全部变量进行检验,看其是否仍然显著,如不显著就将其剔除,知道回归方程中所含的所有变量对y的作用都显著是,才考虑引入新的变量。

再在剩下的未选因子中,选出对y作用最大者,检验其显著性,显著着,引入方程,不显著,则不引入。

直到最后再没有显著因子可以引入,也没有不显著的变量需要剔除为止。

逐步回归分析时在考虑的全部自变量中按其对y的贡献程度大小,由大到小地逐个引入回归方程,而对那些对y作用不显著的变量可能是中不被引入回归方程。

另外,已被引入回归方程的变量在引入新变量进行F检验后失去重要性时,需要从回归方程中剔除出去。

逐步回归算法步骤:

Step1计算变量均值:

差平方和:

记各自的标准化变量为:

Step2计算

的相关系数矩阵

Step3设已经选上了

个变量:

互不相同,

经过变换后为:

逐一计算标准化变量

的偏回归平方和:

记:

作F检验:

对给定的显著性水平

,拒绝域为:

Step4转到Step3循环,直至最终选上了

个变量

,且

互不相同,

经过变换后为:

则对应的回归方程为:

通过代数运算可得:

逐步回归是用Matlab统计工具箱中的命令stepwise,它提供了一个交互式画面,通过这个工具你可以自由地选择变量,进行统计分析,其方法通常为:

stepwise(x,y,inmodel,alpha)

其中x是自变量数据,y是因变量数据,分别为n×m和n×1矩阵,inmodel是矩阵x的列数的指标,给出初始模型中包括的子集(缺省时设定为空),alpha为显著性水平。

StepwiseRegression窗口,显示回归系数及其置信区间,和其它一些统计量的信息。

绿色表明在模型中的变量,红色表明从模型中移去的变量。

在这个窗口中有Export按钮,点击Export产生一个菜单,表明了要传送给Matlab工作区的参数,它们给出了统计计算的一些结果。

下面以美国的指标为y值,其他国家的指标为x值进行逐步回归的结果:

,由此认为美国和巴西,中国,日本,俄罗斯之间的节点存在边,各边权重分别为-0.4606,-0.4921,0.5677,0.191.具体运算界面见图1

图1逐步回归结果图(USA)

同样方法可以得到其他各国节点在网络中的边和权重。

各国数据如表6

表6网络中国家节点边和权重

 

USA

AUS

BRA

CHN

JPN

RUS

ZAF

GBR

常数项

USA

 

0

-0.4606

-0.4921

0.5677

0.191

0

0

0.5118

AUS

0

 

0

0

0

-0.7831

0

-0.5625

2.3883

BRA

-0.4973

0

 

-0.3407

0.3206

0

0

0

-0.4133

CHN

-0.6625

0

0

 

0.718

0.3529

-0.6411

-0.8937

-0.4951

JPN

0.7807

0

0

0.8548

 

-0.5061

0.4372

0.6933

0.2677

RUS

0

-0.4953

0

0.2168

-0.6611

 

0.3652

0

2.133

ZAF

0

0

0

-0.9761

0.4575

0.2597

 

-1.3095

-1.5355

GBR

0

-0.11

0

-0.6519

0.364

0

-0.4864

 

-0.6103

经过matlab运算后的逐步回归结果整理后得到有向复杂网络图如图2,其中各节点的作用的方向和作用权重如图:

图2八国家的复杂网络图及权重

5.3.2有向复杂网络模型计算分析

随着复杂网络研究的不断深入,在原有的基于无权网络的ER随机图模型、WS小世界模型和无标度网络模型BA模型基础上,文献[9]给出了一个由边和节点权值驱动网络动态演化的BBV模型。

所谓的BBV网络模型[6,7]是2004年BarratBarthelemy和vesPignani提出的一个无向加权的网络演化模型。

首先定义一个有向加权网络:

设图DWG=(V,E)表示一个复杂网络。

其中V表示节点集,E表示边集。

总节点数一记为N,边数记为M,

E中每条边都有V中的一对点与之相对应。

任意两点i和j对应的边(i,j)和(j,i)不同。

入强度:

出强度:

其中所有Vi的所有邻接点Aij表示i和j之间有连接的边,且边的指向性是节点i指向节点j。

有向复杂网络的平均最短路径长度:

平均距离定义:

实际中网络的平均最短距离:

在有向加权网络中,i的度有出入度之分。

因此,需要分别考虑邻接点与i之间的关系。

设节点i的邻接点为Ki,其中Kin,表示Ki作为源节点与i相连的节点,Kout表示Ki,作为目的节点与i相连的节点。

在有向加权网络的分析中,为了更好的统一属性,主要考虑以i为源节点的相邻节点。

设Ki个节点之间的实际边数为Ei,则一记节点i的聚类系数为Ci:

网络的聚类系数记为:

各表现网络节点的基本参数值,入强度,出强度,聚类系数,最短路径和权值的数据如表7所示:

表7网络节点的基本参数值

入强度

出强度

聚类系数

最短路径

权值

美国

1.7114

1.9405

0.125

11

0.100027

澳大利亚

1.3456

0.6053

0.71429

12

0.078647

巴西

1.1586

0.4606

0.71429

17

0.067717

中国

3.2682

3.5123

0.19642857

9

0.191018

日本

3.2721

3.0889

0.19642857

9

0.191246

俄罗斯

1.7384

2.0928

0.16071429

10

0.101605

南非

3.0028

1.9299

0.14285714

11

0.175506

英国

1.6123

3.459

0.14285714

10

0.094235

总计

17.1094

17.0893

2.39286571

89

1

其中本复杂网络的实际网络平均最短距离:

显然,

的值是较小的,平均各节点仅需要1.5893的最短距离就可以建立联系,这点体现了复杂网络里的“小世界”特性。

网络聚类系数:

值在[0,1]间,更接近与0,说明网络的的聚集程度较差,凝聚力较差。

所有国家节点中,中国和日本的权值最大,对于整个系统健康状况有较大的影响。

原因可能是这两个国家分别在生活用品和高科技产品有很重要的地位和交流的中心。

对有向复杂网络的基本参数的讨论后,决定通过网络边上的权值来得到网络中各节点的权值。

接下来用网络反馈加权计算八个国家组成的小生态系统的健康来和没有通过网络反馈而直接得到的综合值进行比较。

因此,通过网络可以得到八个国家组成的小世界生态健康指标的总值:

表8网络加权得分和直接综合得分的比较

时间

网络反馈加权得分

直接综合得分

时间

网络反馈加权得分

直接综合得分

1991

0.364447184

0.229314502

2001

0.397829466

0.259401833

1992

0.352459125

0.21578088

2002

0.40408486

0.255952213

1993

0.37245721

0.252210245

2003

0.39174483

0.244295838

1994

0.373917607

0.252173728

2004

0.375449543

0.221100739

1995

0.3695162

0.251945436

2005

0.382170867

0.234912051

1996

0.368170097

0.237820212

2006

0.340898702

0.207891795

1997

0.385066569

0.262875135

2007

0.377473801

0.237697352

1998

0.386963668

0.287174438

2008

0.348495981

0.222164283

1999

0.414326766

0.293726934

2009

0.360717995

0.237959847

2000

0.413090751

0.284997161

2010

0.379222361

0.237210636

图3网络预测值与直接加权值的对比图4修正后模型与直接预测模型的对比

由两者的对比可以观察出网络加权健康得分教直接预测得分高,根据两者特性和趋势对网络加权计算健康的分的模型做如下修正:

修正模型后与直接预测值比较:

见上图4

通过图像可以看出二者总体的趋势和得分差距并不大,可以看出两种综合评价体系是相对合理的。

由于网络加权评价模型考虑了网络中不同节点影响和反馈,因此相信有向复杂网络模型得到的评级得分时更具说明性的,在条件容许的条件下,把全球200多个国家全作为网络节点,运用有向复杂网络来考虑他们间的影响和联系来判断地球总体生态健康水平会更合理可靠。

本模型有很大的推广和扩大价值。

5.3

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1