全国大学生数学建模竞赛C题国家奖一等奖优秀论文Word文档格式.docx
《全国大学生数学建模竞赛C题国家奖一等奖优秀论文Word文档格式.docx》由会员分享,可在线阅读,更多相关《全国大学生数学建模竞赛C题国家奖一等奖优秀论文Word文档格式.docx(23页珍藏版)》请在冰豆网上搜索。
随机误差
脑卒中患病率
五模型的建立与求解
5.1模型一的建立与求解
随着社会的发展,统计学在医疗气象研究中的作用越来越重要,成为一种普遍应用的方法,并为人们所认可,发挥着极其重要的指导性作用。
本文运用SPSS20软件分别从性别、年龄、职业对发病人群进行统计分析。
表1脑卒中不同性别逐年发病情况
年份
性别
频率
百分比
有效百分比
累积百分比
2007
男
7293
55.2
女
5928
44.8
100
合计
13221
2008
10380
54.5
54.6
8646
45.4
19026
99.9
2009
5171
52
4780
48
9951
2010
10537
53.5
9163
46.5
19700
图一脑卒中不同性别发病人数比例趋势图
从上表可以看出,2007年-2010年脑卒中发病人群中,男性高于女性。
分析可能男性普遍有吸烟饮酒的不良生活习惯,还与当前男性可能比女性面临更多的生活压力,导致高血压、糖尿病、高血脂等脑卒中危险因素的增加。
同时从上图可以看出,男性所占比例有下降趋势,女性有上升趋势,因此,性别比例呈减小趋势。
表2脑卒中不同职业逐年发病情况
有效
农民
7164
54.2
68.6
工人
814
6.2
7.8
76.4
退休人员
1905
14.4
18.2
94.7
教师
38
0.3
0.4
95
渔民
18
0.1
0.2
95.2
医务人员
23
95.4
职工
62
0.5
0.6
96
离退人员
416
3.1
4
10440
79
缺失
2781
21
10081
52.9
67.8
1252
6.6
8.4
76.2
2500
13.1
16.8
93
63
93.5
93.7
19
93.8
107
0.7
94.6
809
4.2
5.4
14869
78.1
系统
4172
21.9
19041
1499
15.1
42.4
1479
14.9
41.9
84.3
106
1.1
3
87.3
71
2
89.3
6
89.5
35
1
90.5
313
8.9
99.3
3532
35.5
6419
64.5
11000
55.8
72.1
1302
8.5
80.7
2131
10.8
14
44
94.9
13
253
1.3
1.7
96.7
503
2.6
3.3
15250
77.4
4450
22.6
从上表可以看出:
(1)农民的发病人数最多,其原因可能与农民高血压病例规则用药治疗所占的比率低,抽烟饮酒在人群中比例大,以及膳食结构不合理、摄入膳食结构不合理、摄入动物性优质蛋白少等因素有关。
也可能由于经济状况,对脑卒中的不重视,不能及时治疗脑卒中。
(2)退休人员发病人数较多,其原因可能是退休人员年龄较大,脑供血,脑供氧不足等原因引发脑卒中。
(3)教师,渔民,医务人员,职工,离退人员的发病人数较少。
其原因可能与受教育程度,工作环境等因素有关。
表32007-2010年不同年龄段不同性别患病情况
总人数
年龄
人数
比例
本年龄
本性别
18岁以下
11
52.38%
0.15%
10
47.62%
0.17%
18~40岁
116
59.18%
1.61%
80
40.82%
1.36%
196
41~80岁
5984
57.52%
82.90%
4420
42.48%
75.17%
10404
80岁以上
1107
44.69%
15.34%
1370
55.31%
23.30%
2477
7218
55.11%
100.00%
5880
44.89%
13098
34.55%
0.18%
36
65.45%
0.42%
55
210
69.77%
2.03%
91
30.23%
1.05%
301
8434
56.94%
81.35%
6378
43.06%
73.88%
14812
1705
44.48%
16.44%
2128
55.52%
24.65%
3833
10368
54.57%
8633
45.43%
19001
41
33.33%
0.79%
82
66.67%
1.72%
123
234
60.62%
4.53%
152
39.38%
3.18%
386
4192
53.65%
81.07%
3622
46.35%
75.82%
7814
704
43.32%
13.61%
921
56.68%
19.28%
1625
51.98%
4777
48.02%
9948
62.50%
0.09%
37.50%
0.07%
16
185
62.93%
1.76%
109
37.07%
1.19%
294
8503
55.85%
80.70%
6723
44.15%
73.37%
15226
1839
44.16%
17.45%
2325
55.84%
25.37%
4164
53.49%
46.51%
由上表可知:
(1)18岁以下的青少年患病比例逐年基本呈增长趋势,可见患病年龄比例趋于年轻化。
(2)。
患病人数主要集中在41-80岁,其原因可能是年龄逐渐增长,血液循环所需能量减少,代谢减慢。
(3)80岁以上的患病人群中,女性高于男性
图二2007年脑卒中不同年龄段发病人数趋势图
图三2008年脑卒中不同年龄段发病人数趋势图
图四2009年脑卒中不同年龄段发病人数趋势图
图五2010年脑卒中不同年龄段发病人数趋势图
从上图中可以看出,脑卒中发病高峰年龄段2007年为75-77岁之间,2008年为74-76岁之间,2009年76-78岁之间,2010年为75-78岁之间。
由此可知,脑卒中发病率高峰年龄段为75-77岁之间。
5.2模型二的建立与求解
通过题中所给数据,首先通过单因素分析得出气温、气压、相对湿度对脑卒中发病情况的影响关系大小,其次建立多元线性回归分析模型,最后利用SPSS20软件对数据进行分析,得到气温、气压、相对湿度与发病情况的关系。
5.2.1单因素模型的建立
假设a为给定的显着性水平,则列出:
气温、气压、相对湿度分别对脑卒中的影响程度分析,即单因素分析,公式如下:
若
,表明均值之间的差异显着,该因素对观测值有显着影响。
表明均值之间的差异不显着,该因素对观测值没有显着影响。
5.2.2模型的求解
利用SPSS20得出平均温度、最高温度、平均气压、最低气压、平均相对湿度、最小相对湿度对脑卒中的影响显着,而最低气温、最高气压对脑卒中的影响不显着。
5.2.3多元化线性回归模型的建立
在大多数的实际问题中,影响因变量的因素不止一个而是多个,因此对这类的问题本文采用多元化的线性回归分析。
根据脑卒中发病率与气温、气压、相对湿度之间的关系建立多元化线性回归模型,如下:
5.2.4多元线性回归模型的基本假定
假设1,解释变量是非随机的或固定的,且各x之间互不相关(无多重共线性)
假设2,随机误差项具有零均值、同方差及不序列相关性,即:
假设3,解释变量与随机项不相关,即:
假设4,随机项满足正态分布,即:
在医学病学研究中经常会遇到某一疾病的发生与变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况,而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用,这时采用一元回归分析预测法是难以奏效的,需要采用多元回归分析预测法。
列出多元线性回归模型的一般表现形式为:
将n个统计数据代入上述模型,则问题转化为:
5.2.5模型的求解
利用SPSS20软件对数据进行分析,得到气温、气压、相对湿度之间的关系如下:
表4回归效果检验表
Anovad
模型
平方和
df
均方
F
Sig.
回归
.003
8
.000
3.866
.002a
残差
39
总计
.006
47
7
4.511
.001b
40
.002
4.656
.001c
.004
a.预测变量:
(常量),最小相对湿度,最低气压,平均相对湿度,最高气压,最高温度,最低温度,平均气压,平均温度。
b.预测变量:
(常量),最小相对湿度,最低气压,平均相对湿度,最高气压,最高温度,平均气压,平均温度。
c.预测变量:
(常量),最小相对湿度,最低气压,平均相对湿度,最高温度,平均气压,平均温度。
d.因变量:
患病比例
由以上结论可知:
p<
0.05,气温、气压、相对湿度具有统计学意义。
表5脑卒中与气象资料回归分析SPSS20回归分析
系数a
非标准化系数
标准系数
t
相关性
共线性统计量
B
标准误差
试用版
零阶
偏
部分
容差
VIF
(常量)
0.051
0.618
0.082
0.935
0.003
0.001
2.05
2.362
0.023
-0.015
0.354
0.283
0.019
52.645
-0.754
-1.005
0.321
-0.042
-0.159
-0.12
0.025
39.383
-0.002
-1.267
-3.695
-0.105
-0.509
-0.442
0.122
8.226
0.002
1.336
1.194
0.24
0.048
0.188
0.143
0.011
87.492
-1.336
-2.403
0.021
0.004
-0.359
-0.287
0.046
21.611
0.287
0.282
0.779
0.075
0.045
0.034
0.014
72.452
-0.001
-0.716
-4.181
-0.312
-0.556
-0.5
0.487
2.053
0.499
2.235
0.031
0.337
0.267
3.489
0.095
0.591
0.16
0.873
2.159
2.811
0.008
0.406
0.332
0.024
42.206
-0.894
-1.603
0.117
-0.246
-0.189
22.263
-1.293
-3.949
-0.53
-0.467
0.13
7.668
1.605
2.776
0.402
0.328
0.042
23.921
-1.388
-2.68
-0.39
-0.317
0.052
19.203
-0.719
-4.248
-0.558
-0.502
0.488
2.049
0.526
2.638
0.012
0.385
0.312
0.351
2.847
0.071
0.602
0.907
1.238
2.385
0.022
0.349
0.054
18.559
-1.093
-3.544
-0.484
-0.427
0.153
6.554
1.791
3.104
0.436
0.374
0.044
22.957
-1.479
-2.82
0.007
-0.403
-0.34
0.053
18.972
-0.718
-4.164
-0.545
0.557
2.752
0.009
0.395
0.331
2.821
a.因变量:
图六回归标准化残差的P-P图
分析以上结果得到最优化的回归方程:
图七2007-2010年月平均气压与患病比例的双轴变化图
图八2007-2010年月平均相对湿度与患病比例的双轴变化图
图九2007-2010年月平均温度与患病比例的双轴变化图
由回归方程结合折线图可得出各因素与脑卒中发病率的影响如下:
(1)脑卒中发病率与平均温度成正相关,即平均温度越高,发病率越高。
与最高温度成负相关,即最高温度越低,发病率越高。
(2)脑卒中发病率与平均气压成正相关,即平均气压越高,发病率越高。
与最低气压成负相关,即最低气压越低,发病率越高。
(3)脑卒中发病率与平均相对湿度成负相关,即平均相对湿度越低,发病率越高。
与最小相对湿度成正相关,即最小相对湿度越高,发病率越高。
5