课程设计Word文档格式.docx
《课程设计Word文档格式.docx》由会员分享,可在线阅读,更多相关《课程设计Word文档格式.docx(29页珍藏版)》请在冰豆网上搜索。
![课程设计Word文档格式.docx](https://file1.bdocx.com/fileroot1/2023-1/14/7ef42789-d392-44d0-877f-9b98de26c3c4/7ef42789-d392-44d0-877f-9b98de26c3c41.gif)
3.2建立模型5
4 模型求解6
5 模型检验7
6 模型评价8
7结论与体会9
8参考文献9
摘要
摘要:
本文选取100个糖尿病人作为样本,研究糖尿病人胰岛素含量,生长素含量之间的关系,并通过糖尿病人身体里胰岛素和生长素含量来预测病人病情程度。
通过研究建立Logistic回归模型,并使用最大似然估计法对模型中的参数进行估计,然后根据拟合优度检验法对模型进行检验。
最后利用SPSS统计软件对糖尿病人的病情程度建立模型,进行系统的分析并将预测结果与实际结果进行比对。
得出结论。
关键词:
Logistic回归模型;
拟合优度;
最大似然估计;
回归系数
1问题重述
1.1问题背景
血糖是血液中的葡萄糖,血糖含量维持一定水平,对于保证人体各组织器官特别是脑组织的正常机能活动是非常重要的。
血糖的根本来源是食物中的糖类,若不进食血糖趋于降低,则肝糖原分解作用加强,当长期饥饿时,则肝脏糖异生作用增强,因而血糖仍能继续维持在正常水平。
血糖的主要去路是在组织器官中氧化供能,也可合成糖原贮存或转变成脂肪及某些氨基酸等,血糖从尿中排出不是一种正常的去路,只是在血糖浓度超过肾糖阈时,一部分糖从尿中排出,称为糖尿。
所以血糖含量是划分糖尿病人病情程度的依据。
胰岛素对人体的糖脂肪和蛋白质代谢都有影响,但对于糖代谢的调节作用尤为明显,胰岛素能够促进血液中的葡萄糖(血糖)进入组织细胞被储存和利用。
缺乏胰岛素时,血糖难以被组织细胞摄取,糖的贮存和利用都将减少,这时血糖浓度如果过高,就会有一部分从尿液中排出,形成糖尿。
所以如果是因为胰岛素分泌不足导致,可以通过注射胰岛素制剂来治疗。
生长素能促进骨、软骨、肌肉以及其他组织细胞分裂增生,蛋白质合成增加。
通过生长介素促进蛋白质合成;
促进脂肪分解与氧化;
抑制外周组织摄取与利用葡萄糖,提高血糖浓度。
胰岛素是降低血糖的,与胰高血糖素是对应的,生长激素的生物学作用是促进生长,促进代谢,可以促进蛋白质的合成,促进脂肪分解与氧化,抑制外周组织摄取与利用葡萄糖,提高血糖浓度,当血糖降低时,可刺激生长激素的产生。
由此可见,胰岛素,血糖含量,生长素之间存在一定的关系。
本文通过调查某医院的糖尿病人到医院的就医情况。
搜集了100例糖尿病人的血糖含量、生长素含量、胰岛素含量。
研究这三个量之间的关系。
并通过生长素和胰岛素对病人的病情程度重新分类。
本例定义100名糖尿病人身体里血糖为Y(mmol/L),胰岛素为
(mmol/L),生长素为
(mmol/L)通过查阅资料使用血糖的含量来对糖尿病人的病情进行分类,将糖尿病的情分为正常(
7.0mmol/L)轻度(7.0-8.4mmol/L),中度(8.4-10.1mmol/L),重度(
mmol/L),分别赋值为0,1,2,3,则用生长素和胰岛素来预测糖尿病人的病情程度。
1.2数据
某医院100位糖尿病人身体里的血糖含量,胰岛素生长素含量。
序号
Y
X1
X2
1
12.21
15.2
9.51
51
13.2
11.6
11.45
2
14.54
16.7
11.43
52
13.3
11.7
12.04
3
12.27
11.9
7.53
53
7.43
19.33
10.02
4
14
12.17
54
7.44
19.34
9.09
5
7.88
19.8
2.33
55
8.48
17.78
12.9
6
11.1
16.2
13.52
56
8.49
17.79
12.09
7
10.43
17
10.07
57
8.38
20.28
7.32
8
13.32
10.3
18.89
58
10.09
18.14
8.45
9
19.59
5.9
13.14
59
6.9
27.17
4.34
10
9.05
18.7
9.63
60
26.45
5.98
11
6.44
25.1
5.1
61
9.58
18.07
4.27
12
9.49
16.4
4.53
62
9.59
18.08
5.96
13
10.16
22
2.16
63
9.66
17.97
12.8
23.1
4.26
64
9.67
17.98
9.9
15
18.9
3.42
65
9.68
18.47
16
7.71
25
7.34
66
9.69
18.48
8.1
11.38
14.8
12.75
67
9.54
17.96
10.23
18
10.82
11.2
10.88
68
9.55
11.24
19
12.49
13.7
11.06
69
9.56
6.25
20
9.21
24.4
9.16
70
17.93
8.34
21
7.11
19.01
2.71
71
9.52
17.94
7.21
7.19
19.09
4.72
72
9.53
17.95
9.22
23
7.23
19.13
11.73
73
16.5
14.9
12.2
24
8.26
20.16
12.74
74
17.6
8.27
20.17
9.75
75
15.4
10.31
26
6.23
26.98
4.76
76
17.7
16.1
14.7
13.1
7.77
77
17.3
15.7
28
13.4
9.78
78
17.1
15.5
8.15
29
6.78
26.09
7.67
79
17.2
15.6
9.3
30
11.8
10.2
11.56
80
16.6
7.09
31
8.94
18.24
11.34
81
15.1
6.14
32
7.26
19.16
13.81
82
17.8
33
5.76
27.34
83
17.9
16.3
6.1
34
26.13
9.89
84
17.4
15.8
11.19
35
9.6
18.09
7.97
85
17.5
15.9
12.7
36
9.61
18.1
11.13
86
16.8
19.21
37
9.62
18.11
5.14
87
16.9
15.3
38
18.12
12.15
88
9.92
17.91
39
9.64
18.13
89
9.93
17.92
40
9.65
90
12.08
12.43
8.97
41
6.03
27.43
4.09
91
12.05
14.09
7.98
42
6.54
27.02
5.42
92
9.94
9.4
43
7.24
19.14
6.02
93
9.95
4.5
44
7.31
7.03
94
9.96
23.4
45
12.45
95
9.97
24.5
46
7.41
19.31
12.6
96
11.78
13.09
14.99
47
8.25
20.15
9.87
97
6.08
27.15
4.07
48
13.03
98
9.98
18.31
5.95
49
11.08
99
9.99
18.32
8.96
50
6.12
26.19
8.11
100
14.66
9.11
2模型假设
2.1假设
生长素,胰岛素,血糖含量之间存在相关性,可用Logistic回归模型解决该问题
2.2符号说明
Y:
血糖
X1:
胰岛素
X2:
生长素
:
分别为每个糖尿病人病情程度为正常,轻度,重度,重度的概率
:
待估参数
样本数据
3模型建立
3.1相关性分析
首先检验变量之间也就是生长素,胰岛素,血糖含量之间是否存在相关性,不存在相关性就无法进行分析。
(1)
建立数据文件,定义变量Y:
血糖,X1:
胰岛素,X2:
生长素;
(2)选择Analyze
regression
liner
stastic;
将Y移入Dependent(因变量),将X1,X2移入Covariate(协变量)中;
(3)选择选项output,设置选项,Estimate,Confidenceintervals,Covariancematrix,Modelfit;
(4)单击continue
ok,输出统计结果如下:
图3-1相关系数表
(5)分析:
由相关系数矩阵表可知:
因变量Y与自变量X1存在着负相关性,相关系数为0.840,与X2存在着正相关性,相关系数为0.638,并且X1与X2之间的相关系数为-0.663,说明X1与X2之间存在着负的相关性。
表中*越多表示相关性越强。
综上所叙,我们可以用Logistic回归模型进行相关分析。
3.2建立模型
根据Logistic回归模型的基本定义,对本例可建立Logistic回归模型如下所示;
(3-1)
其中,
为待估参数,
为样本数据,即为100个糖尿病人身体里的生长素含量和胰岛素含量
4模型求解
模型中的各待估参数,可以由SPSS软件操作完成。
具体操作步骤如下:
(1)选择菜单Analyze
Regression
BinaryLogistic
ordinal;
(2)选择一个被解释变量Y到Dependent框,选择
和
到Covariates框;
(3)单击Options选项,出统计结果如下;
图4-1模型回归参数表
(4)分析:
从图4-5看出,sig小于0.05,所以通过检验,则样本数据可以代入回归方程。
其中Estimate就是所求出的待估参数。
将待估参数带入公式(3-1),可建立以下回归模型:
(4-2)
(4-3)
(4-4)
=
(4-5)
其中,每组
分别为每个糖尿病人病情程度为正常,轻度,重度,重度的概率。
由于计算比较繁琐,所以借助matlab软件,依次代入100个样本数据,分别计算出各个样本的四个p值见附表2。
对原始数据进行处理,对病情程度按血糖含量分类,处理结果见附表3。
5模型检验
5.1用spss操作检验
对于Logistic回归模型,采用模型拟合优度表进行检验;
具体检验基本步骤如下;
(1)在spss中导入数据;
(2)执行操作Analyze
Ordinal;
(3)如图,选择一个被解释变量Y到Dependent框,选择
(4)单击ok,输出统计结果如下:
图5-1模型拟合优度表
(5)分析:
图显示pearson检验中P=0.924,Deviance检验中的P=1.000,很接近于1,则可看出模型的预测出结果与实际结果很相似,说明了用Logistic回归模型来构造糖尿病人病情程度与生长素血糖素之间关系是比较合理的,样本数据基本上都可以拟合回归方程。
5.2预测结果与实际结果比对检验
在算出每个样本的四个概率
之后,比较每个样本四个概率的大小,也就是比较病人病情在哪个程度的概率更大,则把病人预测为哪个病情程度。
然后将100个病人的预测结果与实际结果作比对。
预测结果和真实结果的比对表见附表4。
根据真实结果和预测结果的对比,预测结果与真实结果有四个样本不相符,可以看出,用胰岛素和生长素来预测病人病情程度是合理的,并且预测出的病情程度与真实病情程度是基本吻合的。
6模型评价
模型优点:
1.建立模型步骤严谨,浅显易懂;
2.模型求解详细易于理解;
3.模型类型仅扣实际,适合应用在实际生活中。
模型不足:
由于对相关知识掌握的不够,所以在模型解释上存在一些不足,不易于读者正确理解。
7结论与体会
7.1结论
从附表4,可以看到,预测结果与实际结果有四个不相符,吻合度达到了95%以上。
所以用病人体内胰岛素和生长素含量来预测出的病人病情程度与血糖含量划分的病情程度基本是一致的,由此可见,选择Logistic模型在预测糖尿病人病情程度中的应用是比较合理,而且得出的方程拟合度较高。
7.2体会
通过这次课程设计,我对Logistic回归模型有了系统的了解。
Logistic回归模型在解决实际问题中有很重要的意义,有些实际问题解决起来很复杂麻烦,但通过Logistic回归模型以及SPSS和MATLAB软件的结合应用,就能很清楚的得到解决,给我们带来了很大的方便。
通过这次的设计我更加熟悉了用计算机软件来解决数学问题,很多的数学问解决起来很复杂,但是应用计算机软件就可以轻松的解决这些问题,用SPSS和MATLAB中自带的软件非常方便。
而且通过本次的设计我彻底的了解了Logistic回归模型的意义以及应用,我也会学习更多的数学相关知识,并运用到学习和生活中,相信这对我今后的学习和生活都会有很大的帮助。
8参考文献
[1]王全众.两类分析相关数据的Logistic回归模型[M].统计研究,2007,24(02):
81—83.
[2]王济川,郭志刚.Logistic回归模型一方法与应用[M].高等教育出版社,2001.
[3]何晓群,刘文卿.应用回归分析[M].中国人民大学出版社,2001.
[4]何晓群.实用回归分析[M].高等教育出版社,2008.
[5]施朝健,张明铭.Logistic回归模型分析[M].计算机辅助工程,2005,14(03):
74—78.
[6]郝黎仁,樊元.spss实用统计分析[M].中国水利水电出版社,2003.
[7]何晓群,刘文卿.应用回归分析[M].中国人民大学出版社,2001.
[8]张业武.Cox比例风险模型对条件Logistic回归参数估计原理和方法[J].中国卫生统计,2002,19
(1):
[9]田考聪,曾庆,王润华.医用多元统计分析[M].西南交通大学出版社,1995
[10]张岩波,何大卫,梁执群.多分类反应变量的多项式模型及其应用[M].中国卫生统计,2000,17(3):
151–1531
附表1:
附表2:
P值计算结果
P1
P2
P3
P4
程度
0.0018
0.0019
0.4730
0.5233
0.0016
0.3133
0.2933
0.3918
0.0047
0.2748
0.3100
0.4105
0.0071
0.3821
0.2170
0.3938
0.0000
0.4431
0.3842
0.1727
0.0038
0.3844
0.2201
0.3917