数学实验论文城市空气污染数据的真实性判别及分析研究Word文件下载.docx
《数学实验论文城市空气污染数据的真实性判别及分析研究Word文件下载.docx》由会员分享,可在线阅读,更多相关《数学实验论文城市空气污染数据的真实性判别及分析研究Word文件下载.docx(35页珍藏版)》请在冰豆网上搜索。
X4:
NO2的含量(NO2为二氧化氮)
X5:
SO2的含量(SO2为二氧化硫)
ε:
随机误差
p:
相关系数矩阵
2.3模型建立
模型一的建立
空气质量指数AQI为y与PM2.5的含量为x1,PM10的含量为x2,CO的含量为x3,NO2的含量为x4,SO2的含量为x5之间的多元线性回归模型为
y=+x1+x2+x3+x4+x5+ε
其中,,,,,是带估计的回归系数,ε是随机误差。
3.模型计算
3.1问题一的计算
利用matlab命令:
[b,bint,r,rint,s]=regress(y,X),rcoplot(r,rint)
得到残差分析表
图2-1-6
再由残差置信区间得出异常数据第8、25、26、31、33、36、37、38、39、40、50、51、56、57、79、223、229、276组
得到
回归模型的系数(置信区间95%)
表3-1
回归系数
回归系数估计值
回归系数置信区间
16.0434
[11.993020.0938]
0.0819
[-0.03950.2033]
0.6750
[0.58780.7622]
13.9480
[7.877120.0189]
-0.2308
[-0.3666-0.0951]
-0.3412
[-0.5515-0.1309]
R2=0.8221F=439.0060p<
0.0001s2=171.8599
有表中数据可知的置信区间包含零点,所以这个系数的解释是不可靠的。
再用matlab中的corrcoef命令直接得到相关系数矩阵
1.00000.93100.72220.72940.70940.8542
0.93101.00000.66620.77140.75430.8948
0.72220.66621.00000.57310.51470.6670
0.72940.77140.57311.00000.71830.6412
0.70940.75430.51470.71831.00000.6194
0.85420.89480.66700.64120.61941.0000
又表中数据可知X1与X2关系显著,所以X1多余,应当去掉。
去掉X1后再用上述方法得到残差分析表
图2-1-7
由残差置信区间得出异常数据第8、25、26、31、33、36、37、38、39、40、50、51、56、57、79、223、229、276,321组
得到回归模型的系数(置信区间95%)
表3-2
15.0105
[11.257918.7631]
0.7207
[0.66580.7756]
15.4721
[9.833121.1111]
-0.2314
[-0.3672-0.0955]
-0.3380
[-0.5484-0.1276]
R2=0.8214F=547.4489p<
0.0001s2=172.1328
得到线性回归方程y=15.0105+0.7207x2+15.4721x3-0.2314x4-0.3380x5
数据真实性判定:
表3-3
组数
AQI指数
PM2.5
PM10
CO
NO2
SO2
异常点(为0异常)
301
55
31
49
0.75
17
4
321
5
11
0.54
3
347
27
54
0.71
210
64
57
0.79
14
229
15
20
8
415
34
75
0.99
39
10
461
62
0.8
18
25
65
43
160
0.76
19
24
115
44
63
1.3
28
7
243
85
74
1.05
16
86
107
162
1.32
61
466
87
94
0.93
26
209
88
59
93
1
223
89
50
60
0.62
13
276
0.66
12
367
0.68
99
141
1.34
40
102
42
68
1.12
35
22
137
103
77
106
0.95
51
105
37
56
416
124
1.13
208
108
80
147
38
109
138
184
1.57
159
213
1.82
69
73
1.31
30
408
131
110
120
157
1.74
45
29
111
52
21
207
66
104
1.24
431
1.53
116
129
1.4
470
134
1.17
125
217
0.97
373
126
92
140
458
133
98
135
33
78
117
90
1.18
166
1.27
82
41
433
151
114
181
1.76
83
36
154
281
279
2.21
161
183
1.43
32
180
219
1.63
79
186
143
1.19
432
195
148
231
1.9
358
284
2.43
3.2问题二的计算
由表中数据观测出有些组的数据与其它组的数据相差过大,视为不真实数据,其中不真实数据有第8、25、26、31、33、36、37、38、39、40、50、51、56、57、79、223、229、276,321组
数据严重性检验
表3-4
残差置信区间
18.87681
69.75424
-89.0618
-40.0897
-69.5421
-20.3308
-62.6926
-12.3918
5.133861
56.25462
-94.2584
-46.5631
100.6592
143.4668
24.43334
75.05522
-50.225
0.483303
10.75959
61.61226
-55.7525
-6.30494
22.46512
73.14018
-76.169
-27.3825
35.48537
85.75471
10.82924
61.02353
7.169517
58.27083
3.816541
55.02984
21.97953
72.79697
0.02272
51.26964
残差置信区间到原点最小值
0-20
20-50
>
严重程度
轻微
中等
严重
轻微严重的有第8、31、33、39、40、50、79、223、229、321组
中等严重的有第25、26、36、38、51、56、57、276组
强烈严重的有第37组
3.3问题三的计算
3.2.1数据不真实的类型和原因
(1)各级发布数据存在差异,各自自成体系
(2)实时空气质量指数评价滞后
(3)城市空气质量无评价方法
3.2.2为环境保护和政策制定提供的对策
(1)国家、省、市三级业务平台实现统一数据
(2)用均值法计算城市各污染物浓度
(3)调整空气实时报发布方式
4.模型推广
4.1问题四的计算
相关性分析:
舟山市月平均AQI指数与钢材产量
表3-5
时间
钢材产量
2013年12月
164.48
198.1
2013年11月
111.93
178.1
2014年12月
100.24
194.8
2014年11月
74.61
163.2
2014年10月
68.52
167.7
2014年9月
60.9
187.4
2014年8月
60.07
198.4
2014年7月
68.81
196.7
2014年6月
66.37
200.5
2014年5月
94.23
204.5
2014年4月
76.93
200
2014年3月
82.5
204.7
2014年2月
89.24
191.3
用matlab中的corrcoef命令直接得到相关系数矩阵
1.00000.1301
0.13011.0000
一般认为,两个变量的相关系数超过0.85时才具有显著的相关关系
因为0.1301<
0.85
所以AQI与钢材产量相关性不显著
所以舟山不能用空气质量数据的变化来展示工业生产(例如钢产量)等数据的实际情况
参考文献
[1]环境空气质量标准,中华人民共和国国家标准,GB3095-2012
[2]环境空气质量指数(AQI)技术规定(试行):
中华人民共和国国家环境保护标准,
HJ633-2012
[3]《资源节约与环保》2013年,第十二期
[4]方开泰:
实用多元统计分析.上海:
华东师范大学出版社,1989。
[5]高惠璇:
应用多元统计分析.背景:
北京大学出版社,2005
[6]王学民:
应用多元分析(第二版).上海:
上海财经大学出版社,2004
[7]Ghanem,D.,&
Zhang,J.(2014).‘Effortlessperfection:
’DoChinesecitiesmanipulateairpollutiondata.JournalofEnvironmentalEconomicsandManagement,68
(2),203-225.
[8]王正林等.精通MATLAB科学计算(第二版).北京:
机械工业出版社,2006
[9]董维国,深入浅出MATLAB7.x混合编程.北京:
机械工业出版设,2006
[10]龚纯,王正林.MATLAB语言常用算法程序集(第二版).北京:
电子工业出版社,2008
[11]张志刚等.MATLAB与数学实验(第二版)。
北京:
中国铁道出版社,2003
[12]姜启源等.数学模型(第四版)。
高等教育出版社,2011
附录
舟山市的空气质量和气候数据
表3-6
0.51
2
0.52
48
0.59
53
0.64
0.56
6
58
95
0.92
113
0.74
9
46
23
47
0.43
100
132
174
1.15
112
70
76
1.04
67
0.84
71
0.77
0.94
155
72
119
1.08
0.67
0.6
0.98
84
81
97
1.11
0.9
0.73
0.7
0.34
0.5
0.41
0.61
0.33
0.39
0.72
177
136
1.37
0.55
0.89
0.69
1.06
91
128
96
1.26
0.87
101
0.96
1.35
118