水质评价.docx
《水质评价.docx》由会员分享,可在线阅读,更多相关《水质评价.docx(21页珍藏版)》请在冰豆网上搜索。
水质评价
如何更科学地评价饮用水质
摘要
本文通过对长江流域主要城市水质检测资料的统计及分析,对长江流域的水质情况进行了尽可能详尽的研究,首先我们对调查数据(包括水中主要污染物种类及其在全流域的分布状况等)通过EXCEL进行简单统计后给出了长江流域水质的定性分析,并结合掌握数据的特点(污染物种类比较少,且污染水平随不同污染物数量的增加方向不同),通过多元统计分析方法以及结合SPSS软件进行主成分分析,建立了水质综合评价指标CSWQ(CompositiveStandardofWaterQuality)并说明了它的合理性,接着用这一指标对湘江流域的湖南长沙新港水质进行了定量分析,得出了湘江流域的湖南长沙新港水质CSWQ平均得分为8.34758,得出水质大致为III级或II级水质等基本符合饮用水的重要结果。
对于问题二,我们将问题一得出的结果与与参考文献《长江水质的评价和预测》连接为:
,水质均为Ⅰ~Ⅲ类,属可饮用水,与我们的结果水质较好的是湖北丹江口胡家岭、四川攀枝花、重庆朱沱、四川宜宾凉姜沟,较差的是江西南昌滁槎,四川乐山岷江大桥,四川泸州沱江二桥,湖南长沙新港,进行对比得出结果大致吻合,说明我们的方法合理,但考虑到我们仅仅采取2003年6月数据进行举例分析会对结果产生一定的影响。
对于问题三,本文采用的是多元统计分析中的主成份分析法,与模糊评价、层次分析法相比减少了主观评分对结果的影响,且考虑到水质的评价指标太多,采用主成分分析法,通过分析变量之间的相关性,使得所反映信息重叠的变量被某一主成份替代,减少了变量数目,从而降低了系统评价的复杂性,能够得到更合理的结果。
[关键词]长江SPSS软件多元统计分析CSWQ水质分类水质预测
一、问题重述
据水文地理学家的估算,地球上的水资源总量约为13.8亿立方公里,其中97.5%是海水(13.45亿立方公里)。
淡水只占2.5%,其中绝大部分为极地冰雪冰川和地下水,适宜人类享用的仅为0.01%.下面的附表是国标(GB3838-2002)给出的《地表水环境质量标准》中4个主要项目标准限值,其中Ⅰ、Ⅱ、Ⅲ类为可饮用水。
请以某一水域为研究对象,解决以下问题:
(1)采用相应的方法评价该水域的水是否符合饮用水的饮用标准(不要采用模糊评价或层次分析方法)
(2)请以你查阅的参考文献中的数据为基础,与文章中的结论进行对比,哪个更好?
(3)请将你的方法与其他方法(如模糊评价、层次分析)进行比较,哪个方法更好,为什么?
表:
《地表水环境质量标准》(GB3838—2002)中4个主要项目标值 单位:
mg/L
序
号
分类
标准值
项 目
Ⅰ类
Ⅱ类
Ⅲ类
Ⅳ类
Ⅴ类
劣Ⅴ类
1
溶解氧(DO) ≥
7.5
(或饱和率90%)
6
5
3
2
0
2
高锰酸盐指数(CODMn)≤
2
4
6
10
15
∞
3
氨氮(NH3-N) ≤
0.15
0.5
1.0
1.5
2.0
∞
4
PH值(无量纲)
6---9
二、条件假设
1.各观测站给出的数据是准确的;
2.各观测站给出的数据可以反映出长江水质真实情况;
3.每个观测站的水质可以代表其所在地区的水质状况;
4.I,II,III类水是可饮用水指经过净化后可以饮用,不是指能直接饮用;
5.各种污染物流入长江干流后都能与江水充分混合。
三、符号说明
CSWQ:
CompositiveStandardofWaterQuality,水质综合评价指标;
DO:
表示溶解氧;
CODMn:
高锰酸盐指数;
NH3-N:
表示氨氮;
PH:
溶液酸碱度,值由低到高表示溶液由酸性逐渐转向碱性;
Cd:
表示溶解氧的浓度,单位mg/l;
Cc:
表示高锰酸盐指数的浓度,单位mg/l;
Cn:
表示氨氮的浓度,单位mg/l;
Cp:
表示PH的取值,无量纲;
注:
上述符号是模型讨论过程中的全局性符号,在后面的分步讨论我们可能引入新的局部性符号
四、问题分析
问题一的分析:
在考察了近两年来长江水域各调查数据(如水中主要污染物种类及其在全流域的分布状况等)的基础上,参考了一些水质评价方面的资料,并结合掌握数据的特点(污染物种类比较少,且污染水平随不同污染物数量的增加方向不同),提出了一种简单而实用的水质评价的新指标,对长江近两年多的水质情况做出了定量的综合评价,并且具体分析了各地区水质的污染状况(如主要污染物及各时期污染水平等)。
问题二的分析:
问题二的要求是以你查阅的参考文献中的数据为基础,与文章中的结论进行对比,哪个更好?
我们通过查阅参考文献(长江水质的评价)得出的结果,与我们求解的结果进行比较哪个更符合水质评价指标及实际情况,哪个结果更好。
问题三的分析:
对于问题一中采取的多元统计分析方法与其他方法(如模糊评价、层次分析)进行比较,总结出各方法的优缺点,评价出哪种方法更合理,误差值少,更能反映实景情况。
五、模型建立与求解
问题一的求解:
水质综合评价:
对于问题一,我们以长江流域主要城市水质检测报告中2003年6月份的数据进行分析,我们通过
多元统计分析的方法分析四项指标,定义并建立了贴合
本问题的水质综合评价指标CSWQ。
们使用主成分分析方法来寻找已知指标之间的关系,是基于如下考虑:
如果用所
给几个指标综合能够反映出水质的好或坏,那么这些指标之间一定是有某些本质上的联
系的,也就是说,对于同一观测水体这些指标的取值是有关联的,通过对已知数据进行
主成分分析,找出它们之间的内在联系,并提取出这种联系将它作为一项综合评价指标
来评价水质。
这就是我们建立CSWQ的基本思想。
我们建立出如下的CSWQ模型:
CSWQ=
Cp+
Cd+
Cc+
Cn
可以看出,CSWQ实际上就是四个指标的线性加权求和。
这里的关键是如何合理的确
定四个权系数,对此,我们从实际数据出发,运用主成分分析方法得出特征值最大的主
成分作为CSWQ,当然,在主成分分析中,一个需要注意的问题是得到的主成分应当具有
一定的实际意义,否则运用主成分分析就是不成功的,对此我们也说明了CSWQ是如何
真实反映水质情况的。
首先,我们把附表中的数据进行提取,把它拼成一个矩阵
其中,每行中的四个值分别是四项指标的观测值,
为避免数值计算过程中“大数吃小数”的情形,将这个矩阵标准化,将它
作为待分析的数据阵,输入数学软件进行主成分分析,得到的结果:
表一:
CSWQ=
Cp+
Cd+
Cc+
Cn中的系数
a(p)
a(d)
a(c)
a(n)
0.700
0.794
-0.520
-0.849
从上述结果看到:
PH(Cp)和溶解氧(Cd)的系数是正的,表明当这两个量增大时CSWQ
增大,高锰酸盐指数(Cc)和氨氮(Cn)的系数是负的,表明当这两个量增大时CSWQ减
小,这与当前我国采用的水质分级原则是一致的,并说明了CSWQ与水质情况是正对应的
(即水质越好,指标值越高)。
在这里,我们注意到指标中Cp的系数是正的,而且系数
较大,表明水质PH值增大时CSWQ也增大,即水质越好,这似乎与我国水质分级制中对待
PH的原则不太一样,但考虑到我国水体污染的一个严重后果就是酸雨的形成,因此当PH
值升高(即酸性降低)时认为水质好转也未尝不可,另外可以看到数据集中各例的PH值
相差不大,所以这里将Cp的系数这样制定还是比较合理的。
以上分析也同时说明了我们研究
的这个问题是确有其特殊性的。
为了进一步说明这样定义的CSWQ的合理性,我们计算了附件三中2003年6月的实测数据对应的CSWQ值,如下表2所示:
表二:
序号
点位名称
发布时期
2003年6月
CSWQ值
1
四川攀枝花
10.5303
2
重庆朱沱
10.27388
3
湖北宜昌南津关
7.66719
4
湖南岳阳城陵矶
8.64652
5
江西九江河西水厂
9.05849
6
安徽安庆皖河口
8.60598
7
江苏南京林山
9.21921
8
四川乐山岷江大桥
5.23083
9
四川宜宾凉姜沟
10.20497
10
四川泸州沱江二桥
5.76094
11
湖北丹江口胡家岭
13.1189
12
湖南长沙新港
7.23879
13
湖南岳阳岳阳楼
9.47515
14
湖北武汉宗关
9.31309
15
江西南昌滁槎
7.40784
16
江西九江蛤蟆石
9.01943
17
江苏扬州三江营
9.62225
表三:
将对应的CSWQ值惊醒排名如下所示:
序号
点位名称
CSWQ值
排序
11
湖北丹江口胡家岭
13.1189
1
1
四川攀枝花
10.5303
2
2
重庆朱沱
10.27388
3
9
四川宜宾凉姜沟
10.20497
4
17
江苏扬州三江营
9.62225
5
13
湖南岳阳岳阳楼
9.47515
6
14
湖北武汉宗关
9.31309
7
7
江苏南京林山
9.21921
8
5
江西九江河西水厂
9.05849
9
16
江西九江蛤蟆石
9.01943
10
4
湖南岳阳城陵矶
8.64652
11
6
安徽安庆皖河口
8.60598
12
3
湖北宜昌南津关
7.66719
13
15
江西南昌滁槎
7.40784
14
12
湖南长沙新港
7.23879
15
10
四川泸州沱江二桥
5.76094
16
8
四川乐山岷江大桥
5.23083
17
由上表知:
附件三中2003年6月各观测站点水质较差的是江西南昌滁槎,四川乐山岷江大
桥,四川泸州沱江二桥,湖南长沙新港,较好的是湖北丹江口胡家岭、四川攀枝花、重庆朱沱、
四川宜宾凉姜沟。
资料显示,这些地区的高污染型工厂很多,但GDP并不很高,它们用高污染
来换取经济效益是得不偿失的。
将其画成曲线,并将它与实测数据原先所定级别进行了对照,结果见
表四:
表五:
2003年6月实测数据对应CSWQ值与国家水级标准相对变化情况如下:
水及变化
Ⅱ
Ⅱ
Ⅲ
Ⅱ
Ⅱ
Ⅱ
Ⅱ
Ⅳ
Ⅱ
Ⅳ
Ⅰ
Ⅲ
Ⅲ
Ⅱ
Ⅲ
Ⅱ
Ⅱ
曲线变化
-
微降
降
微升
微升
微降
升
降
升
降
升
降
升
微降
降
升
微升
按照两者的相对变化趋势来看,CSWQ较好地反映了水质分级情况。
CSWQ的使用
至此,我们就有了一个用来评价水质的定量指标,有了这个指标,我们就可以从多
个方面对长江水质进行分析了。
下面,我们选取湘江流域的湖南长沙新港的28个月的数据进行水质分析。
湘江流域28个月来CSWQ的评价情况:
对于每个月,我们计算了湖南长沙新港28个月的CSWQ得分,条形图表六如下:
图6湘江流域28个月的CSWQ得分情况
从上图看到,近两年来,湘江水质比较稳定,其中有几段时间水质较好,对应的时
间段大概是2004年1月及2005年2月,两个时间均是隆冬季节,为什么冬季水质会
比较好呢?
我们查阅了相关资料,发现长江冬季水位下降,因而航运能力下降,船舶污
染减少,另外由于各方面的原因(如电力保障,市场需求等),大部分工厂在冬季的生
产量会有所下降,我们认为这些原因较好地解释了这一时期长江水质好转的现象。
但长
江水质总体上仍不容乐观,平均CSWQ指标只有8.34758,大致相当于Ⅲ级或II级水。
仅仅达到了作为饮用水来源的标准。
问题二的求解:
结果比较:
参考文献的结果:
较好好的两个地区是江苏南京林山和湖北丹江口胡家岭,水质最差的两个地区是江西南昌滁槎和四川乐山岷江大桥,水质均为Ⅰ~Ⅲ类,属可饮用水。
我们的结果:
水质较好的是湖北丹江口胡家岭、四川攀枝花、重庆朱沱、四川宜宾凉姜沟,较差的是江西南昌滁槎,四川乐山岷江大桥,四川泸州沱江二桥,湖南长沙新港,基本属于可饮用水。
进行对比得出结果大致吻合,说明我们的方法合理。
问题三的求解:
方法比较:
多元统计分析的优缺点:
优点
1)克服了多重共线性问题;
2)抓住了分析问题的主要矛盾;
3)计划了计算过程;
4)是一种使用、有效的分析方法。
缺点
传统主成份分析方法进行无量纲化处理的方法是“中心标准化”方法,会消除各指标差异程度上的差异,进而会丢失一部分信息的数据。
模糊及层次分析的方法的优缺点:
1)计算复杂,设权的时候主观性太强,结果会带来一定的主观性;
2)一致性检验只能检查出数据的逻辑错误;
3)模糊评价通过精确的数字手段处理模糊的评价对象,能对蕴藏信息呈现模糊行的资料做出比较科学合理
、贴近实际的量化评价;
六、模型的评价
模型的优点:
对于问题一,我们建立定义了比较好的综合指标:
CSWQ,它能够比较全面的对水质进行分析,除此之外,我们采用SPSS进行主成份分析法能够更简单的评价水质等级
模型的缺点:
模型的改进:
七、参考文献
[1]刘则毅等,科学计算方法与Matlab,科学出版社,2001年9月
[2]郑彤等,环境系统的数学模型,化学工业出版社,2003年4月
[3]国家海洋局天津海水淡化与综合利用研究所,《地表水环境质量标准》,
http:
//www.sdmu,2005.9.17
[4]王守荣等,全球水资源与水循环,气象出版社,2003年3月
附录
附录一:
CSWQ=
Cp+
Cd+
Cc+
Cn中的系数通过MATLAB求解过程如下:
a=[7.66.80.20.1;7.638.412.80.34;7.077.815.80.55;7.586.472.90.34;7.346.191.70.13;7.526.543.20.22;7.786.93.10.11;7.664.25.80.53;8.017.632.40.25;7.634.023.61.06;8.6310.21.80.1;7.426.454.30.99;7.736.261.40.21;86.432.40.17;6.645.181.10.92;7.286.872.70.15;7.296.91.60.15]
原始矩阵:
7.60006.80000.20000.1000
7.63008.41002.80000.3400
7.07007.81005.80000.5500
7.58006.47002.90000.3400
7.34006.19001.70000.1300
7.52006.54003.20000.2200
7.78006.90003.10000.1100
7.66004.20005.80000.5300
8.01007.63002.40000.2500
7.63004.02003.60001.0600
8.630010.20001.80000.1000
7.42006.45004.30000.9900
7.73006.26001.40000.2100
8.00006.43002.40000.1700
6.64005.18001.10000.9200
7.28006.87002.70000.1500
7.29006.90001.60000.1500
标准化矩阵:
0.05350.0947-1.6856-0.8354
0.12351.20280.0311-0.0976
-1.18240.78992.01180.5479
0.0069-0.13240.0971-0.0976
-0.5528-0.3251-0.6952-0.7432
-0.1331-0.08420.2952-0.4665
0.47320.16360.2291-0.8047
0.1934-1.69472.01180.4864
1.00950.6660-0.2330-0.3743
0.1235-1.81860.55932.1157
2.45532.4348-0.6292-0.8354
-0.3662-0.14621.02151.9005
0.3566-0.2769-0.8933-0.4973
0.9862-0.1599-0.2330-0.6203
-2.1851-1.0202-1.09141.6854
-0.69270.1429-0.0350-0.6817
-0.66940.1636-0.7612-0.6817
附录二:
通过SPSS主成份分析结果如下:
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.657
Bartlett'sTestofSphericity
Approx.Chi-Square
11.704
df
6
Sig.
.069
CorrelationMatrix
x1
x2
x3
x4
Correlation
x1
1.000
.463
-.084
-.433
x2
.463
1.000
-.206
-.533
x3
-.084
-.206
1.000
.419
x4
-.433
-.533
.419
1.000
Communalities
Initial
Extraction
x1
1.000
.490
x2
1.000
.631
x3
1.000
.270
x4
1.000
.721
ExtractionMethod:
PrincipalComponentAnalysis.
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
2.112
52.803
52.803
2.112
52.803
52.803
2
.961
24.027
76.829
3
.521
13.036
89.865
4
.405
10.135
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
ComponentMatrixa
Component
1
x1
.700
x2
.794
x3
-.520
x4
-.849
Undefinederror#11401-Cannotopentextfile"D:
\学习工具\SPSS\STATIS~1\19\lang\en\spss.err":
Nos
a.1componentsextracted.
附录三:
1长江流域主要城市水质检测报告
发布日期;2003-06
序号
点位名称
断面情况
主要监测项目(单位:
mg/L)
水质类别
主要污染指标
pH*
DO
CODMn
NH3-N
本月
上月
1
四川攀枝花
干流
7.6
6.8
0.2
0.1
II
Ⅱ
2
重庆朱沱
干流(川-渝省界)
7.63
8.41
2.8
0.34
II
Ⅱ
3
湖北宜昌南津关
干流(三峡水库出口)
7.07
7.81
5.8
0.55
III
Ⅲ
4
湖南岳阳城陵矶
干流
7.58
6.47
2.9
0.34
II
Ⅱ
5
江西九江河西水厂
干流(鄂-赣省界)
7.34
6.19
1.7
0.13
II
Ⅱ
6
安徽安庆皖河口
干流
7.52
6.54
3.2
0.22
II
Ⅱ
7
江苏南京林山
干流(皖-苏省界)
7.78
6.9
3.1
0.11
II
Ⅱ
8
四川乐山岷江大桥
岷江(与大渡河汇合前)
7.66
4.2
5.8
0.53
IV
Ⅳ
溶解氧
9
四川宜宾凉姜沟
岷江(入长江前)
8.01
7.63
2.4
0.25
II
Ⅱ
10
四川泸州沱江二桥
沱江(入长江前)
7.63
4.02
3.6
1.06
IV
Ⅳ
溶解氧、氨氮
11
湖北丹江口胡家岭
丹江口水库(库体)
8.63
10.2
1.8
0.1
I
Ⅰ
12
湖南长沙新港
湘江(洞庭湖入口)
7.42
6.45
4.3
0.99
III
Ⅲ
13
湖南岳阳岳阳楼
洞庭湖出口
7.73
6.26
1.4
0.21
II
Ⅲ
14
湖北武汉宗关
汉江(入长江前)
8
6.43
2.4
0.17
II
Ⅱ
15
江西南昌滁槎
赣江(鄱阳湖入口)
6.64
5.18
1.1
0.92
III
Ⅲ
16
江西九江蛤蟆石
鄱阳湖出口
7.28
6.87
2.7
0.15
II
Ⅱ
17
江苏扬州三江营
夹江(南水北调取水口)
7.29
6.9
1.6
0.15
II
Ⅱ