数学建模 戒烟问题.docx

上传人:b****3 文档编号:24897956 上传时间:2023-06-02 格式:DOCX 页数:41 大小:172.88KB
下载 相关 举报
数学建模 戒烟问题.docx_第1页
第1页 / 共41页
数学建模 戒烟问题.docx_第2页
第2页 / 共41页
数学建模 戒烟问题.docx_第3页
第3页 / 共41页
数学建模 戒烟问题.docx_第4页
第4页 / 共41页
数学建模 戒烟问题.docx_第5页
第5页 / 共41页
点击查看更多>>
下载资源
资源描述

数学建模 戒烟问题.docx

《数学建模 戒烟问题.docx》由会员分享,可在线阅读,更多相关《数学建模 戒烟问题.docx(41页珍藏版)》请在冰豆网上搜索。

数学建模 戒烟问题.docx

数学建模戒烟问题

2014高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

B题

我们的参赛报名号为(如果赛区设置报名号的话):

79

所属学校(请填写完整的全名):

河南理工大学

参赛队员(打印并签名):

1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

日期:

2014年9月3日

赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

摘要

本文针对戒烟和各种相关因素关系,解决影响戒烟成功的因素有哪些的问题,我们利用Excel,spss,Matlab软件对相关数据进行分析,利用主成分分析法、层次分析法建立模型,并进行可靠性检验,得到影响戒烟成功的重要因素,对有志于戒烟的人士提供戒烟对策和建议。

针对问题一,首先观察数据发现数据残缺,运用spss中缺失值替换的线性插值法将缺失数据补充完整。

然后求出在不同年龄段、不同性别、不同调整CO浓度下、不同每日抽烟数的条件下的发病累加率,并运用Excel,Matlab,Spss的等软件做出图像,结合图像对发病累加率的分布进行分析,得到累加发病率的基本趋势为随着每日抽烟数和调整CO浓度的增加而提高,男性比女性的累加发病率略低。

针对问题二,首先用spss做其它各变量与戒烟天数的相关性分析,得到显著性(双侧)值,CO浓度和戒烟天数0.01水平显著相关,距离最后一支烟的分钟数和调整的CO浓度与戒烟天数0.05水平显著相关;然后,根据题意,CO浓度和距离最后一支烟的分钟数共同影响调整的CO浓度;可以得到每日抽烟数和调整的CO浓度会影响戒烟时间(天数)长短。

最后,对相关变量的数据进行分组,在不同区间对戒烟天数求平均值,然后用spss回归分析中曲线估计对数据进行拟合,再用MATLAB拟合求回归方程中系数的置信区间来分析拟合效果。

得到每日抽烟和戒烟天数的回归方程为

=0.948,F=12.038,Sig=0.078,可得拟合效果较好;调整的CO浓度和戒烟天数的回归方程为

=0.785,F=12.799,Sig=0.005,拟合的较好。

针对问题三,我们认为CO浓度和距抽最后一支烟的分钟数是来控制调整CO浓度的,这两个因素可以用调整CO浓度说明,因此在考虑戒烟成功主要因素时没有针对这两个因素讨论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整CO浓度影响。

就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。

先用主成分分析法对影响因素探究,再运用层次分析法,根据主成分分析得到的累计贡献率来建立判断矩阵,并算出各成分的权向量。

结果显示影响戒烟成功的因素主要为每天抽烟数,调整CO浓度和年龄。

其比重分别为37.15%,25.00%,23.22%。

通过一致性检验,判断矩阵具有满意一致性,可以为模型提供可靠分析。

针对问题四,我们根据前三问所得结果向有志于戒烟的人士提供相应的戒烟对策及建议,撰写的报告具体见5.4问题四的求解。

关键字:

线性插值法相关性分析回归分析主成分分析层次分析法

一、问题的重述

众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。

为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。

本文研究数据涉及234人,他们都自愿表示戒烟但还未戒烟。

在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。

CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响,因此抽最后一支烟的时间可以用来调整CO的水平。

记录下研究对象的性别、年龄及自述每日抽烟支数。

这个调查跟踪1年,考察他们一直保持戒烟的天数,由此估计这些人中再次吸烟的累加发病率,也就是原吸烟者戒烟一段时间后又再吸烟的比例.其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1年)的天数。

假定他们全部没有人中途退出研究。

请回答下列问题:

1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。

2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?

如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。

3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。

4)请根据你的模型,撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。

二、模型的假设

1、原烟民戒烟天数不足365天的数据都是可靠的;

2、原烟民戒烟的可信度很低,可以说他们多数是再犯者;

3、自愿者中全部没有人中途退出研究。

三、符号说明

符号

符号说明

年龄

性别

每日抽烟数

调整的CO浓度

戒烟天数

权向量

一致性指标

随机一致性指标

一致性比率

最大特征根

四、问题的分析

4.1问题一的分析

针对问题一,首先对缺失数据进行补充,然后求出在不同因素下,不同年龄段、不同性别、不同每日抽烟数、不同调整CO浓度条件下的累加发病率的分布情况,并作出图表,进行分析。

4.2问题二的分析

针对问题二,首先对其它各变量与戒烟天数的相关性分析,得到和戒烟天数相关的变量,然后根据题意,得到会对戒烟天数长短的变量。

对相关变量的数据进行分组处理,求不同区间内戒烟天数的平均值,把组距中间值作为那一组的数值,用spss和MATLAB对数据进行处理得到相关变量和戒烟天数的定量分析结果。

4.3问题三的分析

我们认为CO浓度和距抽最后一支烟的分钟数是来控制调整CO浓度的,这两个因素可以用调整CO浓度说明,因此在考虑戒烟成功主要因素时没有针对这两个因素讨论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整CO浓度影响。

就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。

五、模型的建立与求解

5.1问题一的求解

5.1.1问题一模型的建立

观察附录可以发现,附录中所给数据缺失,为了更加全面的进行分析,首先我们使用spss中缺失值分析命令对于数据进行分析,结果如下。

表5.1.1

列表均值

案例数目

Min_last

LogCOadj

CO

224

177.31

1397.48

257.37

 

列表协方差

Min_last

LogCOadj

CO

Min_last

91053.229

LogCOadj

-27.307

41300.914

CO

-20993.635

22198.708

18998.861

列表相关性

Min_last

LogCOadj

CO

Min_last

1

LogCOadj

.000

1

CO

-.505

.792

1

回归均值a

Min_last

LogCOadj

CO

179.58

1399.76

258.04

a.将随机选中的案例的残差添加到各个估计。

回归协方差a

Min_last

LogCOadj

CO

Min_last

94546.889

LogCOadj

-957.708

40165.315

CO

-20909.166

21649.540

18918.215

a.将随机选中的案例的残差添加到各个估计。

回归相关性a

Min_last

LogCOadj

CO

Min_last

1

LogCOadj

-.016

1

CO

-.494

.785

1

a.将随机选中的案例的残差添加到各个估计。

 

所给数据缺失率为0.0446,缺失率较小,可以利用spss进行补充,然后使用缺失值替换命令进行数据的补充,经过对已有数据的分析,决定使用线性差值法进行补充,补充后数据见附表。

为了直观得了解所有234人的总体戒烟情况,作出如下散点图:

图5.1.1

由图5.1.1看出,被调查的234人中大多数经过很短时间后又再次抽烟,只有少数人戒烟天数达到365天,只占总人数的14.10%,本文假设在研究截止时间内没有再抽烟的烟民戒烟成功,所以累加发病率的具体定义为戒烟天数小于365的烟民数量占研究样本总人数的比例,本文据此对在不同性别、年龄、每日抽烟数、调整后CO浓度的情况下对累加发病率进行比较和分析。

首先运用spss做出男性与女性吸烟者的戒烟天数频率分布图,并求出男性与女性的累加发病率,做出图像,图表如下。

图5.1.2

表5.1.2

性别

成功戒烟人数

总人数

累加发病率

17

110

0.845

16

124

0.871

图5.1.3

由图5.1.2看出男性与女性再次吸烟的累加发病率分布情况相差不大,而由表5.1.1可以发现男性累加发病率为0.845,略低于女性的0.871。

年龄:

通过对所给数据进行分析可以得到参与研究人员的年龄跨度为22—72,所以本文将所有参与研究人员的年龄分为6段,分别为20—29、30—39、40—49、50—59、60—69、70—79,经过统计可以得到不同年龄段的累加发病率的分布,如图所示。

表5.1.3

年龄段

成功戒烟人数

总人数

累加发病率

20-29

4

44

0.91

30-39

11

64

0.83

40-49

8

57

0.86

50-59

7

47

0.85

60-69

1

17

0.94

70-79

1

5

0.80

图5.1.4

通过表5.1.3和图5.1.1可以看出30-59年龄段的累加发病率较低,70岁以上的被研究者累加发病率最低,60-69年龄段的被研究者的累加发病率最高。

每日抽烟数:

首先用Matlab做出每日抽烟数跟戒烟天数的散点图

图5.1.5

通过对数据的分析可发现每日抽烟数的跨度为2—90,所以将每日抽烟数分为7个档次,分别为1—10、11—20、31—40、41—50、51—60、60以上,求出其累加发病率,并做成图表,如下。

表5.1.4

每日抽烟数

戒烟人数

总人数

累加发病率

1—10

4

17

0.765

11—20

10

81

0.877

21—30

12

72

0.833

31—40

4

37

0.892

41—50

1

8

0.875

51—60

0

7

1.000

60以上

2

2

0.000

图5.1.6

通过观察图表可得,每日抽烟数60以上的样本数过少具有偶然性,所以在分析时,可适当忽略,由图表可以看出,基本趋势为每日抽烟数越多则累加发病率越高。

调整CO浓度:

首先用Excel做出调整CO浓度跟戒烟天数的散点图,如下图。

图5.1.7

通过对数据的分析可以得到调整CO浓度的跨度为682—1951,所以将调整CO浓度分为7个区段,分别为600-799、800-999、1000-1199、1200-1399、1400-1599、1600-1799、1800-2000,求出其累加发病率,并做成统计图,图表如下。

表5.1.5

调整的CO浓度

成功戒烟人数

总人数

累加发病率

600-799

1

1

0.000

800-999

2

10

0.800

1000-1199

2

19

0.895

1200-1399

10

73

0.863

1400-1599

15

98

0.847

1600-1799

3

31

0.903

1800-2000

0

2

1.000

图5.1.8

通过图表可以发现累加发病率的趋势是随着调整后CO浓度的增加而提高。

5.2问题二模型的建立与求解

5.2.1问题二模型的建立

由图5.1.2可以看出戒烟天数的长短与性别的关系不明显,由spss软件得到它们的相关系数为0.006,所以可以认为戒烟天数和性别无关。

由spss中双变量相关系分析得到的每个变量之间的相关性数据(见附表),得到变量Age、Gender、Cig_Day、CO、Min_last、LogCOadj和戒烟天数的显著性(双侧)值分别为0.458、0.925、0.686、0.002、0.019、0.037。

表5.2.1相关变量与戒烟天数的相关性

变量

显著性(双侧)值

相关性

Age

0.458

不相关

Gender

0.925

不相关

Cig_Day

0.686

不相关

CO

0.002

0.01水平显著相关

Min_last

0.019

0.05水平显著相关

LogCOadj

0.037

0.05水平显著相关

根据题意变量CO和Min_last可得到LogCOadj。

LogCOadj水平提供了一个自愿者们先前抽烟数量的客观标准,在一定程度上,LogCOadj和Cig_Day有一定的关系。

由此,我们可以主观的认为每日抽烟数和调整的CO浓度能影响戒烟时间的长短。

戒烟天数为365的虽然不能确定其以后会抽烟,但是,他们已经坚持了365天,我们要研究影响因素与戒烟时间的定量分析,就不能忽略365天的数据。

我们分别对每日抽烟数和调整的CO浓度和戒烟天数的数据进行处理。

由上表可得每日抽烟数的范围为[2,90],我们对每日抽烟数以10为组距在[1,90]内分组,处理后的数据为

表5.2.2每日戒烟数和戒烟天数统计表

每日抽烟数

组距中间值

戒烟总天数

总人数

戒烟天数均值

1-10

5.5

3043

17

179.0

11-20

15.5

5395

81

66.6

21-30

25.5

6004

72

83.4

31-40

35.5

2651

37

71.6

41-50

45.5

689

8

86.1

51-60

55.5

200

7

28.6

61-70

65.5

365

1

365.0

71-80

75.5

0

0

0.0

81-90

85.5

365

1

365.0

用Excel可以得到下图

 

图5.2.1每日抽烟数和戒烟天数折线图

由图5.2.1可以看出[61,90]内的两个点均为戒烟天数为365天的,偏离了图形正常的趋势,这两个点只能说明个别情况,不能代表整体趋势,所以把这两个点删除后再处理数据。

表5.2.3删除后每日戒烟数和戒烟天统计表

每日抽烟数

组距中间值

戒烟天数均值

1—10

5.5

179.0

11—20

15.5

66.6

21—30

25.5

83.4

31—40

35.5

71.6

41—50

45.5

86.1

51—60

55.5

28.6

用spss中曲线估计进行拟合,分析后得到立方拟合效果最好。

此时

=0.948,F=12.038,Sig=0.078。

用spss得到拟合的图形,如下:

图5.2.2

表5.2.4每日抽烟数和戒烟天数相关分析表

模型汇总和参数估计值

因变量:

戒烟天数

方程

模型汇总

参数估计值

R方

F

df1

df2

Sig.

常数

b1

b2

b3

三次

.948

12.038

3

2

.078

278.633

-22.711

.760

-.008

自变量为每日抽烟数。

由表5.2.4得到每日抽烟数和戒烟天数的回归分析方程式:

(5-1)

用Matlab求出参数的置信区间

表5.2.5

参数

参数估计值

参数置信区间

常数

278.633

(115.2,442.1)

b1

-22.711

(-46.27,0.8484)

b2

0.760

(-0.1359,1.656)

b3

-0.008

(-0.01748,0.001903)

R2=0.761314F=25.9115P=0.000653633

可以看出每日抽烟数和戒烟天数在整体上呈负相关,

调整的CO浓度与戒烟天数的定量分析

图5.2.3调整的CO浓度值从小到大散点图

由上图和调整的CO浓度频率表可得其在[682,1951]内分布均匀。

我们在[600,1999]内按组距为200

表5.2.6

调整的CO浓度

组距中间值

戒烟总天数

总人数

平均值

600-799

699.5

365

1

365.0

800-999

899.5

889

10

88.9

1000-1199

1099.5

1300

19

68.4

1200-1399

1299.5

6757

73

92.6

1400-1599

1499.5

7815

98

79.7

1600-1799

1699.5

1575

31

50.8

1800-1999

1899.5

11

2

5.5

我们用spss曲线估计拟合得到二次的R方为0.771且为最大值。

此时F值为5.044较小,Sig值为0.110较大,拟合的不好。

模型汇总和参数估计值

因变量:

戒烟天数

方程

模型汇总

参数估计值

R方

F

df1

df2

Sig.

常数

b1

b2

二次

.771

5.044

2

3

.110

1141.496

-1.581

.001

自变量为调整的CO浓度。

图5.2.4

所以我们绝定取组距为100,在[681,1980]内分13组进行处理。

表5.2.7

调整CO浓度

组距中间值

戒烟天数均值

681—780

730.5

365

781—880

830.5

124.67

881—980

930.5

33.25

981—1080

1030.5

104.63

1081—1180

1130.5

58.18

1181—1280

1230.5

115.34

1281—1380

1330.5

81.94

1381—1480

1430.5

89.74

1481—1580

1530.5

73.28

1581—1680

1630.5

52.9

1681—1780

1730.5

2.13

1781—1880

1830.5

35

1881—1980

1930.5

7

图5.2.5

此时R方为0.530,F值为5.646,Sig值为0.023,R方较小,我们考虑到可能是戒烟天数为365天数据的存在造成的影响比较大,因为题目中假设原烟民戒烟的可信度是很低的,在234个数据中戒烟天数为365天的数据为33,其频率为0.141,所以戒烟天数为365天的只是一少部分人,不能代表整体,我们将[681,780]区间内戒烟天数平均值为365的数据删除,再把偏离总趋势较大的点删除后进行处理。

图5.2.6

此时用spss曲线估计拟合得到三次的R方为0.785且为最大值。

此时F值为12.799,Sig值为0.005较大,拟合的较好。

由spss得到的参数估计值,可以得到调整的CO浓度和戒烟天数的回归分析方程式:

(5-2)

由Matlab得到参数的置信区间见下表:

表5.2.8

参数

参数估计值

参数置信区间

常数

117.306

(-504.3,1693)

b2

6.436×10-6

(-0.001076,0.002752)

b3

-1.784×10-8

(-6.782e-7,2.446e-7)

R2=0.785F=12.799P=0.005

可以看出调整的CO浓度和戒烟天数呈负相关。

5.3问题三模型的建立与求解

我们认为戒烟天数达到365天的为戒烟成功,抽取出所有戒烟达到365天的数据,根据成功戒烟的数据分析影响因素。

根据一、二问结论,我们假定戒烟成功受年龄,性别,每日抽烟数以及调整CO浓度影响

为消除不同变量的量纲的影响,且不改变变量的相关系数,首先需要对变量进行标准化处理,标准化处理可通过spss实现。

我们忽略其他因素对戒烟成功的影响,认为年龄,性别,每日抽烟数以及调整CO浓度为影响戒烟成功的主成分,相应的主成分特征值和累计贡献利率如下表:

表5.3.1

解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

合计

方差的%

累积%

1

1.486

37.155

37.155

1.486

37.155

37.155

1.001

25.013

25.013

2

1.000

25.002

62.156

1.000

25.002

62.156

1.000

25.010

50.023

3

.929

23.221

85.377

.929

23.221

85.377

1.000

24.996

75.019

4

.585

14.623

100.000

.585

14.623

100.000

.999

24.981

100.000

提取方法:

主成份分析。

考虑到每一种成分对戒烟成功的影响不一样,为确定各指标对戒烟成功影响的权重,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1