数学建模 2统计模型Word文档下载推荐.docx
《数学建模 2统计模型Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《数学建模 2统计模型Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
4
47
5
6
57
7
26
8
27
9
28
10
29
11
22
12
13
19
14
15
16
23
17
20
18
21
24
1、摘要
在农某医药公司为了掌握一种新止痛药的疗效,设计了一个药物实验,通过观测病人性别、血压和用药剂量与病痛时间的关系,预测服药后病痛明显减轻的时间。
我们运用数学统计工具minitab软件,对用药剂量,性别和血压组别与病痛减轻
时间之间的数据进行深层次地处理并加以讨论概率值P(是否<
0.05)和拟合度R-Sq的值是否更大(越大,说明模型越好)。
首先,假设用药剂量、性别和血压组别与病痛减轻时间之间具有线性关系,我们建立了模型Ⅰ。
对模型Ⅰ用minitab软件进行回归分析,结果偏差较大,说明不是单纯的线性关系,然后对不同性别分开讨论,增加血压和用药剂量的交叉项,我们在模型Ⅰ的基础上建立了模型Ⅱ,用minitab软件进行回归分析后,用药剂量对病痛减轻时间不显著,于是我们有引进了用药剂量的平方项,改进模型Ⅱ建立了模型Ⅲ,用minitab软件进行回归分析后,结果合理。
最终确定了女性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型:
Y=31.8-3.49
+56.1
-9.32
+0.26
对模型Ⅱ和模型Ⅲ关于男性病人用minitab软件进行回归分析,结果偏差依然较大,于是改进模型Ⅲ建立了模型Ⅳ,用minitab软件进行回归分析后,结果合理。
最终确定了男性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型:
Y=32.8-4.02
+0.955
+0.0.0427
关键词止痛剂药剂量性别病痛减轻时间
2、问题的提出
一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物实验,给患有同种病痛的病人使用这种新止痛剂的一下4个剂量中的某一个:
2g,5g,7g和10g,并记录每个病人病痛明显减轻的时间(以分钟计)。
为了了解新药的疗效与病人性别和血压有什么关系,实验过程中研究人员把病人按性别及血压的低、中、高三档平均分配来进行测试。
通过比较给个病人血压的历史数据,从低到高分成三组,分别记作0.25,0.50和0.75.实验结束后,公司的记录结果附录1-1表(性别以0表示,1表示男)。
现在为公司建立一个模型,根据病人用药的剂量、性别和血组别,预测出服药后病痛明显减轻的时间。
3、问题的分析
假定每个患该种病的程度相差不大,即病情基本相同,根据现实,用药量与病痛减轻时间会有一定的关系,一般,药用量越高,病痛减轻时间变得越快;
而更一般,男性身体素质相对于女性来说比较强壮,病痛减轻的时间也会跟性别有关系,正常而言,身体素质越好,病痛减轻时间越快;
另一个,一个人的血压组别的高地也会影响到他的病痛减轻时间的快慢。
对1-1表格中的数据进行相关分析如下:
相关分析:
用药剂量(g),血压组别,知用药剂量(g)和血压组别的Pearson相关系数=0.000P值=1.000;
由此,可以看出用药剂量与血压组别没有关系,如图1-1所示
1-1图
用药剂量(g),性别,知用药剂量(g)和性别的Pearson相关系数=0.000P值=1.000;
由此可以看出用药剂量与性别相互独立。
如1-2图所示
1-2图
根据所给数据可分别作出病痛减轻时间与用药剂血压组别的散点图量,性别及如下:
1-3.1图
1-3.2图
1-3.3图
4、模型假设与符号假设
假设病痛减轻时间只与用药剂量、性别和血压组别有关,不受其他因素的影响,由以上散点图(图1-3.1--图1-3.3)可以作出如下模型假设
模型Ⅰ:
符号说明
1、
为病痛减轻时间量,单位(min);
2、
表示用药剂量单位(g);
3、
表示性别;
4、
表示血压组别;
5、S表示标准差;
6、R-Sq表示线性拟合度。
5、模型的建立
下面用minitab软件对分别对残差对用药剂量、残差对性别和残差对血压组别进行绘图,到出对应的1-4.1图、1-4.2图和1-4.3图,并对这些图进行分析,分别可以看出残差对用药剂量是正常的、残差对性别是正常的、残差对血压组别正常的。
1-4.1图
1-4.2图
1-4.3图
由1-4.1~1-4.3图分析,可以用药剂量和血压组别的乘积表示对病痛减轻时间的交互式影响,性别对病疼减轻时间有显著影响,因此可以对男性和女性分开讨论,得到如下模型:
模型Ⅱ
(1)对女性的进行分析如下:
回归分析:
病痛减轻时间(min)与用药剂量(g),血压组别,用药剂量及血压组别
回归方程为
病痛减轻时间(min)=23.1+0.040用药剂量(g)+59.4血压组别-10.2用药剂量及血压组别交叉项
即Y=23.1+0.040
+59.4
-10.2
自变量系数系数标准误TP
常量23.0966.1083.780.005
用药剂量(g)0.03970.97670.040.969
血压组别59.3811.845.020.001
用药剂量及血压组别-10.1632.021-5.030.001
S=3.37051R-Sq=96.5%R-Sq(调整)=95.2%
方差分析
来源自由度SSMSFP
回归32486.03828.6872.940.000
残差误差890.8811.36
合计112576.92
来源自由度SeqSS
用药剂量(g)12184.16
血压组别114.52
用药剂量及血压组别1287.36
异常观测值
用药剂病痛减轻时拟合值标准化
观测值量(g)间(min)拟合值标准误残差残差
87.011.00017.4951.081-6.495-2.03R
R表示此观测值含有大的标准化残差
因为用药剂量p值为0.969,所以对病痛减轻时间影响不显著,不妨引进用药剂量的平方项加以讨论,因此模型进一步改进为:
模型Ⅲ
病痛减轻时间(min)与用药剂量(g),血压组别,用药剂量及血压组别,用药剂量的平方
回归方程为:
病痛减轻时间(min)=31.8-3.49用药剂量(g)+56.1血压组别
-9.32用药剂量及血压组别+0.264用药剂量的平方
即Y=31.8-3.49
常量31.7795.7555.520.001
用药剂量(g)-3.4941.558-2.240.060
血压组别56.1229.1416.140.000
用药剂量及血压组别-9.3221.579-5.900.001
用药剂量的平方0.26360.10202.580.036
S=2.57789R-Sq=98.2%R-Sq(调整)=97.2%
回归42530.40632.6095.190.000
残差误差746.526.65
用药剂量的平方144.36
由拟合值R-Sq=98.2%可以确定,该模型比较合理。
(2)、对男性用模型Ⅱ进行分析,分析结果如下:
病痛减轻时间(min)=31.5+0.16用药剂量(g)+39.0血压组别
-7.59用药剂量及血压组别
即Y=31.5+0.16
+39.0
-7.59
系数标
自变量系数准误TP
常量31.4813.712.300.051
用药剂量(g)0.1572.0550.080.941
血压组别39.0325.391.540.163
用药剂量及血压组别-7.5883.806-1.990.081
S=7.84538R-Sq=76.6%R-Sq(调整)=67.9%
回归31615.27538.428.750.007
残差误差8492.4061.55
合计112107.67
用药剂量(g)11349.42
血压组别121.13
用药剂量及血压组别1244.72
因为用药剂量p值为0.941,所以对病痛减轻时间影响不显著,不妨引进用药剂量的平方项加以讨论,因此可以利用模型Ⅲ进行分析:
病痛减轻时间(min)=49.8-7.84用药剂量(g)+39.0血压组别
-7.59用药剂量及血压组别+0.667用药剂量的平方
即Y=49.8-7.84
+0.667
常量49.8110.714.650.002
用药剂量(g)-7.8432.784-2.820.026
血压组别39.0316.962.300.055
用药剂量及血压组别-7.5882.543-2.980.020
用药剂量的平方0.66670.20183.300.013
S=5.24268R-Sq=90.9%R-Sq(调整)=85.7%
回归41915.27478.8217.420.001
残差误差7192.4027.49
用药剂量的平方1300.00
由此,可以看出,在男性方面血压组别的P=0.55,对病痛减轻时间不显著,不妨取消血压组别这个单变量,将模型进一步改进。
模型Ⅳ
病痛减轻时间(min)与用药剂量(g),性别,用药剂量及血压组别,用药剂量的平方
*性别(实质上)是常量*性别已从方程中删除。
病痛减轻时间(min)=32.8-4.02用药剂量(g)+0.955用药剂量及血压组别+0.00427用药剂量的平方
Y=32.8-4.02
常量32.7943.4379.540.000
用药剂量(g)-4.02290.5371-7.490.000
用药剂量及血压组别0.95490.85621.120.297
用药剂量的平方0.00426600.00061436.940.000
S=3.36837R-Sq=95.7%R-Sq(调整)=94.1%
回归32016.90672.3059.250.000
残差误差890.7711.35
用药剂量及血压组别1120.36
用药剂量的平方1547.12
1210.05.0000.7932.6914.2072.08R
*注*列中的所有值相同。
用药剂量及血压组别的P=0.297,但是R-Sq=95.7%R-Sq(调整)=94.1%,说明这个模型改进更加合理。
6、模型的优缺点与改进方向
通过回归模型的建立及不断改进过程当中,得知该公司的新药的疗效对于男性和女性的作用程度不一样。
该模型是针对该公司的新药进行建模,不具有普遍性。
7、参考文献
1、姜启源,谢金星,叶俊.数学模型(第三版).高等教育出版社,2003.8(2012重印)
2、马林,何桢.六西格玛管理(第二版).中国人民大学出版社,2007.7(2011.11重印)
3、吴翊,李永乐,胡庆军.应用数理统计.国防科技大学出版社,1995.8(2010.7重印)
8、附录部分