ImageVerifierCode 换一换
格式:DOCX , 页数:41 ,大小:172.88KB ,
资源ID:24897956      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/24897956.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数学建模 戒烟问题.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数学建模 戒烟问题.docx

1、数学建模 戒烟问题2014高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有

2、违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B题 我们的参赛报名号为(如果赛区设置报名号的话): 79 所属学校(请填写完整的全名): 河南理工大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)

3、日期: 2014 年 9 月 3 日赛区评阅编号(由赛区组委会评阅前进行编号):2014高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):摘要本文针对戒烟和各种相关因素关系,解决影响戒烟成功的因素有哪些的问题,我们利用Excel,spss,Matlab软件对相关数据进行分析,利用主成分分析法、层次分析法建立模型,并进行可靠性检验,得到影响戒烟成功的重要因素,对有志于戒烟的人士提供戒烟对策和建议。针对问题一,首先观察数

4、据发现数据残缺,运用spss中缺失值替换的线性插值法将缺失数据补充完整。然后求出在不同年龄段、不同性别、不同调整CO浓度下、不同每日抽烟数的条件下的发病累加率,并运用Excel,Matlab,Spss的等软件做出图像,结合图像对发病累加率的分布进行分析,得到累加发病率的基本趋势为随着每日抽烟数和调整CO浓度的增加而提高,男性比女性的累加发病率略低。针对问题二,首先用spss做其它各变量与戒烟天数的相关性分析,得到显著性(双侧)值,CO浓度和戒烟天数0.01水平显著相关,距离最后一支烟的分钟数和调整的CO浓度与戒烟天数0.05水平显著相关;然后,根据题意,CO浓度和距离最后一支烟的分钟数共同影响

5、调整的CO浓度;可以得到每日抽烟数和调整的CO浓度会影响戒烟时间(天数)长短。最后,对相关变量的数据进行分组,在不同区间对戒烟天数求平均值,然后用spss回归分析中曲线估计对数据进行拟合,再用MATLAB拟合求回归方程中系数的置信区间来分析拟合效果。得到每日抽烟和戒烟天数的回归方程为, =0.948,F=12.038,Sig=0.078,可得拟合效果较好;调整的CO浓度和戒烟天数的回归方程为, =0.785,F=12.799,Sig=0.005,拟合的较好。针对问题三,我们认为CO浓度和距抽最后一支烟的分钟数是来控制调整CO浓度的,这两个因素可以用调整CO浓度说明,因此在考虑戒烟成功主要因素时

6、没有针对这两个因素讨论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整CO浓度影响。就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。先用主成分分析法对影响因素探究,再运用层次分析法,根据主成分分析得到的累计贡献率来建立判断矩阵,并算出各成分的权向量。结果显示影响戒烟成功的因素主要为每天抽烟数,调整CO浓度和年龄。其比重分别为37.15%,25.00%,23.22%。通过一致性检验,判断矩阵具有满意一致性,可以为模型提供可靠分析。针对问题四,我们根据前三问所得结果向有志于戒烟的人士提供相应的戒烟对策及建议,撰写的报告具体见5.4问题四的求解。关键字:线性插值法 相关性分析 回归分析

7、 主成分分析 层次分析法 一、问题的重述众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。 CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的

8、累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1年)的天数。假定他们全部没有人中途退出研究。请回答下列问题:1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型

9、进行可靠性分析。4)请根据你的模型,撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。二、模型的假设1、原烟民戒烟天数不足365天的数据都是可靠的;2、原烟民戒烟的可信度很低,可以说他们多数是再犯者;3、自愿者中全部没有人中途退出研究。三、符号说明符号符号说明年龄性别每日抽烟数调整的CO浓度戒烟天数权向量一致性指标随机一致性指标一致性比率最大特征根四、问题的分析4.1问题一的分析针对问题一,首先对缺失数据进行补充,然后求出在不同因素下,不同年龄段、不同性别、不同每日抽烟数、不同调整CO浓度条件下的累加发病率的分布情况,并作出图表,进行分析。4.2问题二的分析针对问题二,首先对其

10、它各变量与戒烟天数的相关性分析,得到和戒烟天数相关的变量,然后根据题意,得到会对戒烟天数长短的变量。对相关变量的数据进行分组处理,求不同区间内戒烟天数的平均值,把组距中间值作为那一组的数值,用spss和MATLAB对数据进行处理得到相关变量和戒烟天数的定量分析结果。4.3问题三的分析我们认为CO浓度和距抽最后一支烟的分钟数是来控制调整CO浓度的,这两个因素可以用调整CO浓度说明,因此在考虑戒烟成功主要因素时没有针对这两个因素讨论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整CO浓度影响。就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。五、模型的建立与求解5.1问题一的求解5.1

11、.1问题一模型的建立观察附录可以发现,附录中所给数据缺失,为了更加全面的进行分析,首先我们使用中缺失值分析命令对于数据进行分析,结果如下。表5.1.1列表均值案例数目Min_lastLogCOadjCO224177.311397.48257.37列表协方差Min_lastLogCOadjCOMin_last91053.229LogCOadj-27.30741300.914CO-20993.63522198.70818998.861列表相关性Min_lastLogCOadjCOMin_last1LogCOadj.0001CO-.505.7921回归均值aMin_lastLogCOadjCO179

12、.581399.76258.04a. 将随机选中的案例的残差添加到各个估计。回归协方差aMin_lastLogCOadjCOMin_last94546.889LogCOadj-957.70840165.315CO-20909.16621649.54018918.215a. 将随机选中的案例的残差添加到各个估计。回归相关性aMin_lastLogCOadjCOMin_last1LogCOadj-.0161CO-.494.7851a. 将随机选中的案例的残差添加到各个估计。所给数据缺失率为0.0446,缺失率较小,可以利用spss进行补充,然后使用缺失值替换命令进行数据的补充,经过对已有数据的分析

13、,决定使用线性差值法进行补充,补充后数据见附表。为了直观得了解所有234人的总体戒烟情况,作出如下散点图:图5.1.1由图5.1.1看出,被调查的234人中大多数经过很短时间后又再次抽烟,只有少数人戒烟天数达到365天,只占总人数的14.10,本文假设在研究截止时间内没有再抽烟的烟民戒烟成功,所以累加发病率的具体定义为戒烟天数小于365的烟民数量占研究样本总人数的比例,本文据此对在不同性别、年龄、每日抽烟数、调整后CO浓度的情况下对累加发病率进行比较和分析。首先运用spss做出男性与女性吸烟者的戒烟天数频率分布图,并求出男性与女性的累加发病率,做出图像,图表如下。图5.1.2表5.1.2性别成

14、功戒烟人数总人数累加发病率男171100.845女161240.871 图5.1.3由图5.1.2看出男性与女性再次吸烟的累加发病率分布情况相差不大,而由表5.1.1可以发现男性累加发病率为0.845,略低于女性的0.871。年龄:通过对所给数据进行分析可以得到参与研究人员的年龄跨度为2272,所以本文将所有参与研究人员的年龄分为6段,分别为2029、3039、4049、5059、6069、7079,经过统计可以得到不同年龄段的累加发病率的分布,如图所示。表5.1.3年龄段成功戒烟人数总人数累加发病率20-294440.91 30-3911640.83 40-498570.86 50-5974

15、70.85 60-691170.94 70-79150.80 图5.1.4通过表5.1.3和图5.1.1可以看出30-59年龄段的累加发病率较低,70岁以上的被研究者累加发病率最低,60-69年龄段的被研究者的累加发病率最高。每日抽烟数:首先用Matlab做出每日抽烟数跟戒烟天数的散点图图5.1.5通过对数据的分析可发现每日抽烟数的跨度为290,所以将每日抽烟数分为7个档次,分别为110、1120、3140、4150、5160、60以上,求出其累加发病率,并做成图表,如下。表5.1.4每日抽烟数戒烟人数总人数累加发病率1104170.765112010810.877213012720.8333

16、1404370.8924150180.8755160071.00060以上220.000图5.1.6通过观察图表可得,每日抽烟数60以上的样本数过少具有偶然性,所以在分析时,可适当忽略,由图表可以看出,基本趋势为每日抽烟数越多则累加发病率越高。调整CO浓度:首先用Excel做出调整CO浓度跟戒烟天数的散点图,如下图。 图5.1.7通过对数据的分析可以得到调整CO浓度的跨度为6821951,所以将调整CO浓度分为7个区段,分别为600-799、800-999、1000-1199、1200-1399、1400-1599、1600-1799、1800-2000,求出其累加发病率,并做成统计图,图表如

17、下。表5.1.5调整的CO浓度成功戒烟人数总人数累加发病率600-799110.000 800-9992100.800 1000-11992190.895 1200-139910730.863 1400-159915980.847 1600-17993310.903 1800-2000021.000 图5.1.8通过图表可以发现累加发病率的趋势是随着调整后CO浓度的增加而提高。5.2问题二模型的建立与求解5.2.1问题二模型的建立由图5.1.2可以看出戒烟天数的长短与性别的关系不明显,由spss软件得到它们的相关系数为0.006,所以可以认为戒烟天数和性别无关。由spss中双变量相关系分析得到

18、的每个变量之间的相关性数据(见附表),得到变量Age、Gender、Cig_Day 、CO 、Min_last、 LogCOadj和戒烟天数的显著性(双侧)值分别为0.458、0.925、0.686、0.002、0.019、0.037。表5.2.1相关变量与戒烟天数的相关性变量显著性(双侧)值相关性Age0.458不相关Gender0.925不相关Cig_Day0.686不相关CO0.0020.01水平显著相关Min_last0.0190.05水平显著相关LogCOadj0.0370.05水平显著相关根据题意变量CO和Min_last可得到LogCOadj。LogCOadj水平提供了一个自愿者

19、们先前抽烟数量的客观标准,在一定程度上,LogCOadj和Cig_Day有一定的关系。由此,我们可以主观的认为每日抽烟数和调整的CO浓度能影响戒烟时间的长短。戒烟天数为365的虽然不能确定其以后会抽烟,但是,他们已经坚持了365天,我们要研究影响因素与戒烟时间的定量分析,就不能忽略365天的数据。我们分别对每日抽烟数和调整的CO浓度和戒烟天数的数据进行处理。由上表可得每日抽烟数的范围为2,90,我们对每日抽烟数以10为组距在1,90内分组,处理后的数据为表5.2.2每日戒烟数和戒烟天数统计表每日抽烟数组距中间值戒烟总天数总人数戒烟天数均值1-105.5304317179.011-2015.55

20、3958166.621-3025.560047283.431-4035.526513771.641-5045.5689886.151-6055.5200728.661-7065.53651365.071-8075.5000.081-9085.53651365.0用Excel可以得到下图图5.2.1每日抽烟数和戒烟天数折线图由图5.2.1可以看出61,90内的两个点均为戒烟天数为365天的,偏离了图形正常的趋势,这两个点只能说明个别情况,不能代表整体趋势,所以把这两个点删除后再处理数据。表5.2.3删除后每日戒烟数和戒烟天统计表每日抽烟数组距中间值戒烟天数均值1105.5179.0112015.

21、566.6213025.583.4314035.571.6415045.586.1516055.528.6用spss中曲线估计进行拟合,分析后得到立方拟合效果最好。此时=0.948,F=12.038,Sig=0.078。用spss得到拟合的图形,如下:图5.2.2表5.2.4每日抽烟数和戒烟天数相关分析表模型汇总和参数估计值因变量:戒烟天数方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1b2b3三次.94812.03832.078278.633-22.711.760-.008自变量为 每日抽烟数。由表5.2.4得到每日抽烟数和戒烟天数的回归分析方程式: (5-1)用Matlab求出参

22、数的置信区间表5.2.5参数参数估计值参数置信区间常数278.633(115.2, 442.1) b1-22.711(-46.27, 0.8484) b20.760(-0.1359, 1.656)b3-0.008(-0.01748,0.001903)R2=0.761314 F=25.9115 P=0.000653633可以看出每日抽烟数和戒烟天数在整体上呈负相关,调整的CO浓度与戒烟天数的定量分析图5.2.3调整的CO浓度值从小到大散点图由上图和调整的CO浓度频率表可得其在682,1951内分布均匀。我们在600,1999内按组距为200表5.2.6调整的CO浓度组距中间值戒烟总天数总人数平均

23、值600-799699.53651365.0 800-999899.58891088.9 1000-11991099.513001968.4 1200-13991299.567577392.6 1400-15991499.578159879.7 1600-17991699.515753150.8 1800-19991899.51125.5 我们用spss曲线估计拟合得到二次的R方为0.771且为最大值。此时F值为5.044较小,Sig值为0.110较大,拟合的不好。模型汇总和参数估计值因变量:戒烟天数方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1b2二次.7715.04423.11

24、01141.496-1.581.001自变量为 调整的CO浓度。图5.2.4所以我们绝定取组距为100,在681,1980内分13组进行处理。表5.2.7调整CO浓度组距中间值戒烟天数均值681780730.5365781880830.5124.67881980930.533.2598110801030.5104.63108111801130.558.18118112801230.5115.34128113801330.581.94138114801430.589.74148115801530.573.28158116801630.552.9168117801730.52.1317811880

25、1830.535188119801930.57图5.2.5此时R方为0.530,F值为5.646,Sig值为0.023,R方较小,我们考虑到可能是戒烟天数为365天数据的存在造成的影响比较大,因为题目中假设原烟民戒烟的可信度是很低的,在234个数据中戒烟天数为365天的数据为33,其频率为0.141,所以戒烟天数为365天的只是一少部分人,不能代表整体,我们将681,780区间内戒烟天数平均值为365的数据删除,再把偏离总趋势较大的点删除后进行处理。图5.2.6此时用spss曲线估计拟合得到三次的R方为0.785且为最大值。此时F值为12.799,Sig值为0.005较大,拟合的较好。由sps

26、s得到的参数估计值,可以得到调整的CO浓度和戒烟天数的回归分析方程式: (5-2)由Matlab得到参数的置信区间见下表:表5.2.8参数参数估计值参数置信区间常数117.306(-504.3, 1693) b26.43610-6(-0.001076, 0.002752)b3-1.78410-8(-6.782e-7, 2.446e-7)R2= 0.785 F=12.799 P=0.005可以看出调整的CO浓度和戒烟天数呈负相关。5.3问题三模型的建立与求解我们认为戒烟天数达到365天的为戒烟成功,抽取出所有戒烟达到365天的数据,根据成功戒烟的数据分析影响因素。根据一、二问结论,我们假定戒烟成

27、功受年龄,性别,每日抽烟数以及调整CO浓度影响为消除不同变量的量纲的影响,且不改变变量的相关系数,首先需要对变量进行标准化处理,标准化处理可通过spss实现。我们忽略其他因素对戒烟成功的影响,认为年龄,性别,每日抽烟数以及调整CO浓度为影响戒烟成功的主成分,相应的主成分特征值和累计贡献利率如下表:表5.3.1解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %11.48637.15537.1551.48637.15537.1551.00125.01325.01321.00025.00262.1561.00025.00262.1561.00025.01050.0233.92923.22185.377.92923.22185.3771.00024.99675.0194.58514.623100.000.58514.623100.000.99924.981100.000提取方法:主成份分析。考虑到每一种成分对戒烟成功的影响不一样,为确定各指标对戒烟成功影响的权重,

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1