高教社杯全国大学生数学建模竞赛A题.docx

上传人:b****5 文档编号:8024484 上传时间:2023-01-28 格式:DOCX 页数:27 大小:460.71KB
下载 相关 举报
高教社杯全国大学生数学建模竞赛A题.docx_第1页
第1页 / 共27页
高教社杯全国大学生数学建模竞赛A题.docx_第2页
第2页 / 共27页
高教社杯全国大学生数学建模竞赛A题.docx_第3页
第3页 / 共27页
高教社杯全国大学生数学建模竞赛A题.docx_第4页
第4页 / 共27页
高教社杯全国大学生数学建模竞赛A题.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

高教社杯全国大学生数学建模竞赛A题.docx

《高教社杯全国大学生数学建模竞赛A题.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛A题.docx(27页珍藏版)》请在冰豆网上搜索。

高教社杯全国大学生数学建模竞赛A题.docx

高教社杯全国大学生数学建模竞赛A题

2011高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

_______________

参赛队员(打印并签名):

1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期:

2011年9月12日

 

赛区评阅编号(由赛区组委会评阅前进行编号):

2011高教社杯全国大学生数学建模竞赛

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

基于GS技术的城市土壤重金属污染分析

摘要

本文我们主要解决的问题是如何通过污染物在土壤中的传播特征建立模型求解污染源。

在模型建立的过程当中,我们主要应用了因子分析法,变异函数模型,kringing插值方法,运用GS软件绘图,SPSS软件处理数据。

问题一,运用GS软件对319个离散数据做出该城市重金属浓度分布图,利用内梅罗综合污染指数法求出各区域的样本重金属污染率,得到综合污染程度。

问题二,采用因子分析法,分别对8种重金属污染物的浓度指标进行了因子分析,运用spss统计软件处理数据,将这8项指标归结为5个公共因子,在此基础上根据不同区域的因子得分对各区域环境污染状况进行了总体比较和评价。

问题三,使用变异函数模型,找到理论变异函数,通过kringing插值,进行交叉检验得到浓度的估计值,此时产生一个标准误差。

通过标准误差的范围,确定特异值。

通过GS软件画出特异值的空间分布图,从而找到特异值点,此时的特异值点并非污染源。

我们再根据污染物的传播特征,以及特异值周围的地势情况,综合确定污染源。

问题四,基于已有的关于土壤污染物的传播特征,我们收集了土壤的PH值,城市的规划现况,地层分布,以及土壤类型等相关信息,在已知条件下,假设未知参量,建立数学模型,定量分析这些因素对污染物在土壤中的浓度变化的影响。

关键字:

GS技术内梅罗综合污染指数法因子分析法污染物的传播特征变异函数模型kringing插值方法

 

1、问题的提出

1.1问题背景

随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。

对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。

1.2已知条件

某城区319个采样点的位置、海拔高度及其所属功能区等信息,以及8种主要重金属元素在采样点处的浓度,主要重金属元素的背景值。

1.3目标任务

问题一:

给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。

问题二:

通过数据分析,说明重金属污染的主要原因。

问题三:

分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。

问题四:

分析所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?

有了这些信息,如何建立模型解决问题?

2、问题分析

2.1问题一分析

重金属元素在该区域的空间分布与污染程度紧密相关。

空间分布,即要在图上展现出各元素在空间上的浓度分布。

可采用GS软件将已知数据拟合画出二维图形。

要分析各区域的污染程度,这是一个综合的指标,所以要结合8种污染物共同分析。

基于已有的国际通用污染指数测定法——内梅罗综合污染指数法,我们应该分析不同区域重金属的污染程度需处理样本点重金属浓度数据得到污染样本点占该地区总样本点的百分比,结合分布图得出各区域的污染程度结论。

2.2问题二分析

此问题要求我们对已知数据进行数据分析,由于此问题涉及八种元素,如果单独讨论,选择标准复杂,因此要采用因子分析法进行数据统计和分析,能提炼精简出关联度最强、最具代表性的选择标准,由此构建具有一定合理性和可操作性的数字资源选择标准体系。

得到标准体系后,我们就需要对数据进一步量化处理,如计算方差,标准差,残差,协方差,公因子方差等。

将这些数据经过分析,得到重金属污染的主要原因。

2.3问题三分析

该问题的重点是分析污染物的传播特征,包括传播途径,方式等,再根据他的传播特征建立具体的数学模型,从而定量的来确定污染源。

基于已有的土壤污染物传播特征,查阅相关资料我们了解到,污染物的传播途径大概有4类,但是他们分别是基于大气物理传播,植物根叶吸收,以及溶质的水溶程度理论进行的传播。

这里我们就不对污染源的确定进行定量的分析,只做定性的说明。

又由于我们只知道该城区的海拔高度,而对于城区的城市建筑,河流,气候等情况没有具体的参数,如果自行假设则会增加模型的复杂度,因此,我们就只从地势坡度上来寻找污染源。

根据污染物离散点的浓度分布,基于已有的变异函数模型,通过kringing插值法进行交叉检验,GS绘制图形,得到特异值的空间分布图,再定性和定量相结合确定污染源。

2.4问题四分析

首先是根据建立的模型分别其优缺点。

其次是查阅相关的资料,基于已有的土壤污染物的传播特征分析,我们在此分析的基础上收集关于土壤PH值,土壤厚度等信息。

有了这些信息,我们可以将模型三中定量说明的部分用具体的数据对其定量化,这样就可以得到确定的污染源。

3、模型假设

1)不考虑地质灾害对重金属元素空间分布的影响;

2)不考虑各重金属污染物浓度测量误差;

3)假设不同污染中心向2四周扩散除相互重叠时,污染程度不受重叠影响;

4)污染源的重金属浓度不在增加;

5)取样点的数据较好的反映了该地区的污染物浓度;

4、符号假设

符号

意义

单位

P综

综合污染指数(综合反映各污染物对区域土壤的不同作用)

mg/kg

P平均

所有单项污染指数平均值

mg/kg

P最大

土壤环境中各单项污染指数中的最大值

mg/kg

区域重金属i的单项污染指数

mg/kg

重金属i含量的实测值

mg/kg

重金属i含量的评价起始值

mg/kg

…,

原有变量,是均值为零、标准差为1的标准化变量

/

p

原有变量个数

,…,

因子变量

/

A

因子载荷矩阵

/

在坐标轴

上得投影

/

特殊因子

/

显著性水平

/

样本相关系数矩阵

/

R的特征根

/

特征向量

/

区域化变量

/

方差函数

/

变异函数

/

稳健变异函数

/

传统实验变异函数

/

5、模型建立与求解

5.1模型一的建立与求解

5.1.1模型一的建立

5.1.1.1软件选用和评价方法选择

初步了解各种绘图软件,认识到GS是地统计学的分析软件,它的核心是根据样本点来确定研究对象(某一变量)随空间位置而变化的规律,以此去推算未知点的属性值,可以实现我们对未知数据的拟合。

随后我们查阅知道了国内常用的土壤评价法,由于是分析多种重金属对土壤的污染程度,因此选用内梅罗综合污染指数法,对数据进行处理归纳,总结得出结论。

5.1.1.2土壤评价具体方法

土壤评价方法

内梅罗综合污染指数法。

内梅罗综合污染指数法的计算公式为P综=[(P均+P最大)/2],其中单项污染指数计算计算公式:

评价标准如下表5.1.1.2:

P综

污染等级

污染程度

1

安全

清洁

2

警戒线

尚清洁

3

轻污染

超标

4

中污染

土壤、作物受中度污染

5

重污染

土壤、作物受重度污染

表5.1.1.2内梅罗综合污染指数的分级标准

5.2.2模型一的求解

5.2.2.1GS软件绘制重金属浓度曲面图

5.2.2.2数据处理

根据内梅罗综合污染指数法,通过excel对数据简单处理(见附件一),计算出319个样本点的综合污染指数P综,并依照评价标准,统计出了每个区域各个污染等级的样本点个数,最后计算出该区域清洁和尚清洁以及轻、中、重污染的样本点所占比例。

根据各区域受污染样本点所占比例的大小,从而得出各区域的污染程度。

5.3模型一求解结果

1)重金属浓度曲面图,如下图5.3.1

As

Cd

Cr

Cu

Hg

Ni

Pb

Zn

图5.3.1重金属元素空间分布图

2)采用内梅罗综合污染指数法对土壤的评价结果如下表5.3.1:

样本点个数

样本点所占该区总样点数比例

污染

等级

安全

警戒

轻度污染

中度污染

重度污染

污染

程度

清洁

尚清洁

超标

中度污染

重度污染

清洁、尚清洁

超标、中重度污染

生活区(1区)

2

5

18

7

12

15.9%

84.1%

工业区(2区)

0

0

15

6

15

0

100%

山区(3区)

10

21

30

4

1

46.7%

53.3%

交通区(4区)

2

14

44

30

48

11.6%

88.4%

公园绿地区

(5区)

2

6

15

5

7

22.9%

77.1%

表5.3.1区域土壤重金属综合污染指数评价的结果

3)结论

由上表并结合重金属浓度分布图以及受污染样本点所占该区总样点数比例比较可知:

工业区受污染最为严重,样本污染率达到100%,次之为交通区、生活区、公园绿地样本受受污染率分别为88.4%、84.1%、77.1%,山区环境相对良好,样本受污染率为53.3%。

5.2模型二的建立与求解

5.2.1模型二的建立

5.2.1.1因子分析方法

对该问的八个变量因子处理,运用因子分析方法,多变量的平面数据进行最佳综合和简化,即在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理,并在低维空间解释系统,从而分析重金属污染的主要原因。

5.2.1.2具体数学模型

其中,

…,

为p个原有变量,是均值为零、标准差为1的标准化变量,

,…,

为m个因子变量,m小于p,表示成矩阵形式为

其中F为因子变量或公共金子,可以将他们理解为在高维空间中互相垂直的m个坐标轴。

A为因子载荷矩阵,

为因子载荷,是第i个原有变量在第j个因子变量上得符合。

如果把变量

看成是m维因子空间中的一个向量,则

在坐标轴

上得投影,相当于多元回归中的标准化系数。

为特殊因子,表示了原有变量不能被因子变量所解释的部分,相当于多元回归分析中得残差分析部分。

最主要的问题有两个核心问题:

一是如何构造因子变量;二是如何对因子变量进行命名解释。

5.2.2模型二的求解

5.2.2.1因子分析有下面4个基本步骤:

1)确定待分析的原有若干变量是否适合于因子分析。

2)构造因子变量。

3)利用旋转使得因子变量更具有可解释性。

4)计算因子变量的得分。

5.2.2.2具体求解过程:

1)SPSS软件——SPSS的统计功能是SPSS的核心部分,利用该软件,几乎可以完成所有的数理统计任务。

具体来说,SPSS的基本统计功能包括:

样本数据的描述和预处理,假设检验,方差分析,列联表,相关分析,回归分析等。

我们利用SPSS软件对原始数据做巴特利特球形检验和KMO检验。

巴特利特球形检验显著性水平

KMO检验值

K即可选用因子分析

2)利用SPSS软件求出样本相关系数矩阵

3)利用SPSS软件求R的特征根

和特征向量

4)确定提取公因子的个数,同时利用SPSS软件可得初始因子载荷矩阵

5)使用最大方差旋转法,得到旋转的因子。

6)在提取了已命名可解释性的公因子个数之后,可以求得各因子变量的得分函数。

7)将污染字数代入,可得公因子得分值。

8)综合排列,选取前几个方差最大的主成分

5.2.3模型二的结果

1)描述统计量特征如下表

 

N

全矩

极小值

极大值

均值

统计量

统计量

统计量

统计量

统计量

统计量

统计量

V1

V2

V3

V4

V5

V6

V7

V8

(有效的N列表状态)

319

319

319

319

319

319

319

319

28.52

1579.80

905.52

2526.19

15991.43

138.23

452.80

3727.96

1.61

40.00

15.32

2.29

8.57

4.27

19.68

32.66

30.13

1619.80

920.84

2528.48

16000.00

142.50

472.48

3760.82

1810.80607,90

96464.40

17069.58

17550.34

95607.90

5506.53

19695.36

64183.64

5.6765

302.3962

53.5097

55.0167

299.7113

17.2618

621,7409

201,2026

16933

1259699

3.91935

9.12149

91.23671

55661

280270

18.99338

(有效的N列表状态)

标准差

方差

偏度

峰度

统计量

统计量

统计量

统计量

统计量

统计量

3.02429

224.98760

70.00179

162.91510

1629.53978

9.94142

50.05776

339.23254

9.146

50619,421

4900.251

26541.328

2655399.894

98.832

2505.779

115078.720

3.324

2.024

9.445

12.755

8.596

7.109

4.406

6.490

1.37

1.37

1.37

1.37

1.37

1.37

1.37

1.37

19.696

5.641

104.166

180.685

74.148

81.844

28.308

53.591

272

272

272

272

272

272

272

272

表5.2.3.1描述统计量特征表

2)KMO和Bartlett检验结果如下表

取样足够度的Kaiser-Meyer-Olkin度量

.778

Bartlett的球形检验近似卡方

905.711

df

28

Sig

.000

表5.2.3.2KMO和Bartlett检验

,可以选用因子分析法。

3)样本相关系数矩阵

如下表

V1

V2

V3

V4

V5

V6

V7

V8

相关v1

1.000

.265

.189

.160

.064

.317

.290

.247

V2

.255

1.0000

.352

.397

.265

.329

.660

.431

V3

.189

.352

1.0000

.532

.103

.716

.383

.424

V4

.160

.397

.532

1.000

.417

.495

.520

.387

V5

.064

.265

.103

.417

1.000

.103

.298

.196

v6

.317

.329

.716

.495

.103

1.0000

.307

.436

V7

.290

.680

.383

.520

.298

3.07

1.0000

.494

V8

.247

.431

.424

.387

.436

4.36

.494

1.0000

表5.2.3.3样本相关系数矩阵

4)公因子方差提取值如下表

初始

提取

V1

1.000

0.989

V2

1.000

0.833

V3

1.000

0.844

V4

1.000

0.764

V5

1.000

0.934

V6

1.000

0.842

V7

1.000

0.825

V8

1.000

0.991

表5.2.3.4公因子方差表

5)解释总方差如下表

成分

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

合计

方差的%

累积%

1

3.560

44.500

44.500

3.560

44.500

44.500

2.059

25.733

25.733

2

1.150

14.377

58.877

10150

14.377

58.877

1.767

22.087

47.820

3

0.965

12.063

70.941

0.965

12.063

70.941

1.217

15.215

63.035

4

0.768

9.596

80.537

0.768

9.596

80.537

1.026

12.824

75.858

5

0.578

7.220

87.756

0.578

7.220

87.756

.952

11.898

87.756

6

0.432

5.399

93.156

7

0.301

3.769

96.924

8

0.246

3.076

10.000

表5.2.3.5解释总方差表

运用spss软件的因子分析功能,选择主成分分析法抽取因子,并采用最大方差旋转法旋转主轴,以取得选择标准体系主要的因子机构。

根据累计贡献率大于80%的原则,可以降维确定5个公共因子。

(此处公共因子的具体成分再结果分析中具体说明)

6)碎石图结果如下表

表5.2.3.6碎石图

从碎石图中我们可以看到因子1、2、3、4、5特征值相差比较大,而因子6、7、8特征值相差较小,也可以得出提取5个公因子就能概括绝大部分信息的结论。

7)成分矩阵结果如下表

成分

1

2

3

4

5

V7

0.764

0.314

0.237

0.248

0.158

V4

0.756

0.125

0.365

0.137

0.155

V3

0.735

0.444

0.303

0.046

0.110

V6

0.723

0.515

0.190

0.137

0.014

V2

0.711

0.281

0.282

0.322

0.254

V8

0.699

0.037

0.123

0.241

0.654

V5

0.408

0.673

0.297

0.449

0.154

V1

0.426

0.200

0.681

0.551

0.026

图5.2.3.7成分矩阵

8)旋转成分矩阵如下表

成分

1

2

3

4

5

V3

0.882

0.209

0.002

0.014

.146

V6

0.864

0.089

0.019

0.222

0.196

V4

0.614

0.362

0.505

0.022

0.029

V2

0.170

0.877

0.082

0.102

0.132

V7

0.195

0.832

0.191

0.121

0.208

V5

0.013

0.134

0.953

0.030

0.083

V1

0.131

0.154

0.023

0.970

0.076

V8

0.271

0.285

0.101

0.091

0.904

表5.2.3.8旋转成分矩阵

9)成分得分系数矩阵如下表

成分

1

2

3

4

5

V1

0.071

0.075

0.026

1.020

0.089

V2

0.113

0.689

0.0180

0.059

0.179

V3

0.531

0.040

0.133

0.133

0.107

V4

0.308

0.060

0.342

0.124

0.270

V5

0.124

0.184

0.899

0.059

0.048

V6

0.504

0.204

0.069

0.112

0.006

V7

0.120

0.580

0.062

0.035

0.060

V8

0.144

0.161

0.020

0.073

1.176

表5.2.3.9成分得分系数矩阵

10)旋转空间成分图

图5.2.3.10旋转空间成分图

5.3模型三的建立与求解

5.3.1模型三的建立

5.3.1.1变异函数模型

目前我们已知的是此城区319个离散样本点处的各重金属浓度,但实际中土壤在空间上是连续变异的,查阅地统计学资料我们得知,可以用直线或曲线将这些离散点连接起来绘成连续的变异函数。

用于拟合的曲线方程就称为变异函数的理论模型。

再运用kringing插值计算各金属含量的估计值,从而算出一个标准误差,进行比较,判断特异值,运用GS绘出空间分布图。

具体步骤如下:

1)特异值。

即样本平均值加减3倍标准差,在此区间以外的数据均定为特异值。

由于特异值的存在会对变异函数具有显著的影响,因此计算变异函数前剔除这些特异值是十分有必要的。

在空间估计过程中,空间特异值点位的预测值与其真实值相差较大。

可以利用这一性质识别出空间特异值。

2)变异函数。

传统实验变异函数基于偏差的平方[见公式

(1)],对特异值非常敏感,不具有稳健性。

而稳健变异函数可以减弱空间特异值对变异函数的影响,增加空间估计的准确性与合理性,进而为空间特异值和污染源的识别带来帮助。

查阅相关资料,我们对该城区使用Genton稳健变异函数[见公式

(2)]作为分析工具。

公式

(1)

公式

(2)

其中,

i=1,2,…,N(h)

H是[N(h)/2]+1的整数部分。

公式

(2)的Qn稳健估计量的崩溃点是50%,失误敏感度为2.069,渐近效率为0.82。

3)错误数据处理

对8种元素含量执行适当的探索性数据分析,去掉具有明显错误的数据,并对数据进行适当的变换。

此处我们

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1