ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:98.22KB ,
资源ID:7480177      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7480177.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数学建模之南瓜称重问题.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数学建模之南瓜称重问题.docx

1、数学建模之南瓜称重问题数学建模之南瓜估重问题摘 要 不用天平称量南瓜的重量,如何仅通过南瓜的大小尺寸来估计南瓜的重量。本案例是在根据连续两年的对于一定数量的南瓜高度,水平长度,垂直方向与相应的重量的数据收集,在此基础上,我们建立回归分析方程模型,找出南瓜重量与 其他各数据量之间的关系如下 H=1.3138+0.9004.*x1+0.0272.*x1.2-0.6945.*(x2+x3)./2+0.0082.*(x2+x3)./2)2+0.3262.*x4-0.0068.*x4.2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2 。应用软件找出所给各数据

2、项与重量之间的散点图,找出之间的关系。说明哪些变量是重要的变量,根据之间的关系建立模型,对于模型进行检验可知该模型的缺点。再对于所做的模型进行优化,运用化为二次多项式回归的方法,进行模型改进。应用2003年的数据进行模型的建立与验算,同时应用2004年的数据进行模型的求解,由此求出哪个不是黄南瓜。关键词:南瓜称重 回归分析 高度 水平长度 垂直方向一问题的重述与分析1.1 问题的重述 不用天平估计南瓜重量是某些农村居民在秋天一种常见的竞赛,能否仅通过某些南瓜的尺寸预测出南瓜的重量呢! 现给出以往对于一堆南瓜的尺寸数据与相应的重量数据。根据这些数据资料,利用数学建模的方法,在信息不足的条件下,提

3、出以量化分析为基础的根据尺寸数据对于南瓜重量分析的估计方法,给出一个明确的数学公式,并对于模型进行分析。1.2 问题的分析在此次的建模过程中主要用到回归分析方法,预测一个南瓜的重量与许多因素有关,而这些因素往往又相互制约,如果要确立估计一个南瓜的重量函数关系就必须找出重量与各因素之间的关系。可以利用matlab分析软件对于各数据之间的关系进行描述,然后确立因变量与自变量之间的函数关。二基本假设1. 重量的估计只与南瓜的高度 水平长度 垂直方向1 垂直方向2四个变量有关。2. 在一定范围之内的误差是可以忽略不急的。3. 所给数据是随机产生的,具有一定的代表性。三符号约定X1:南瓜的高度X2:南瓜

4、的垂直方向2X3:南瓜的垂直方向1X4:南瓜的水平长度H:南瓜的重量四模型的建立首先必须讨论所给的数据:高度 水平长度 垂直方向1 垂直方向2 与重量之间的关系。由此,所以第一步需要根据matlab画出各数据之间的散点图,进而确定哪些是重要的变量,进而写出函数关系。(1)重量与高度 程序: clear x1=4 6 7.5 9.5 14.7 19.7 31.2 24.7 32.7 23.2; H=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2; scatter(x1,H)图像如下: 图一(2 )重量与水平长度 程序: clear H=0.25 0.6 0

5、.75 2.4 2.8 7 10.1 12.5 16.9 17.2; x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2; scatter(x4,H)图像如下: 图二(3)重量与垂直方向1 程序: clear H=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2; x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3; scatter(x3,H)图像如下: 图三(4)重量与垂直方向2 程序: clear H=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 1

6、6.9 17.2; x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8; scatter(x2,H)图像如下: 图四从图2与图1可以发现,随着x4和x1的增加,H的值有向上弯曲的增加趋势,而且可以观察到图2的曲线经过原点的,所以图中的曲线可以分别用两条曲线模拟:曲线1:H=a1*x4+a2*x42+b曲线2:H=a0+a1*x1+a2*x12而图3,4中,当x3和x2增加时,H的值有明显的线性增长趋势,图中的散点用直线连起来以后会发现,可以发现可用两条直线来模拟:直线1:H=a0+a1*x3+b直线2:H=a0+a1*x2+b综上所述,可以结合以上四个模型

7、建立回归模型:H=a0+a1*x4+a2*x42+a3*x1+a4*x12+a5*x3+a6*x2+b(其中a0,a1,a2,a3,a4,a5,a6为常数,b是随机误差)五:模型的求解:现在可利用2003年有关南瓜的相关数据来进行模型求解。直接利用MATLAB来进行求解,求解过程及结果如下:程序: clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2; x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;x4=22

8、.8 30.4 31.1 50 46 66 66 85 83.7 101.2;H=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;n=10;X=ones(n,1),x1,x1.2,x2,x3,x4,x4.2; b,bint,r,rint,s=regress(H,X,0.05); b,bint,s, rcoplot(r,rint)结果:b = 1.0334 -0.1556 0.0103 0.1022 -0.1242 -0.0386 0.0020bint = -7.9118 9.9786 -5.0098 4.6985 -0.0104 0.0311 -0.61

9、30 0.8174 -2.9738 2.7253 -1.3954 1.3183 -0.0015 0.0055s = 0.9954 108.9983 0.0013 0.6184程序说明: 语句X=ones(n,1),x1,x1.2,x2,x3,x4,x4.2;表示一个向量矩阵,其中ones(n,1)生成一个n行1列的元素全为1的矩阵。语句 b,bint,r,rint,s=regress(H,X,0.05);中bint是回归系数的置信区间,r是残差(;列向量),rint是残差的置信区间,s包含3个统计量:决定系数R2(相关系数为R);F值;F(1,n-2)分布大于F值的概论p。语句 rcoplot

10、(r,rint)生成一个残差图,即下图: 图五:残差分析结果分析:由结果可得,R2=0.9954在0.8到1之间,可以判断回归自变量具有较强的线性相关性;此模型中F的值要比F(1,n-2)大得多,同样也表现出两者具有较强的线性相关性;p小于显著水平0.05,所以所得的模型有用。模型检验:将2003年的数据带入模型中进行检验程序有:clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2; x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86

11、 97.5 93.3;x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2;H=x1.*0.6255-2.9611.*sqrt(x2+x3)./2)+0.0021.*x4.2+9.9289结果:H= 0.5308 0.3938 0.7466 1.9650 2.8820 7.2972 11.0523 13.4932 15.7066 17.6152模型结果基本与数据相符,所以可以认为此模型是有效的。模型的应用:根据题目的要求将2004年的数据带入到模型中,辨认出其中的白南瓜是哪一个。程序: clear x1=7.4 8.1 8.4 12.5 18 21 19 26

12、.5 25.4 23.5; x2=27.5 35.8 42 46 66 72.5 79 89 89 101.5; x3=27 35.5 41.7 46 64.5 73.5 81 90 89.5 93; x4=27.8 41 50.5 47.5 67.5 74.6 85.8 78.3 90.1 94.5; H=x1.*0.6255-2.9611.*sqrt(x2+x3)./2)+0.0021.*x4.2+9.9289结果:H=0.7232 0.8455 1.3828 2.4026 6.8370 9.4516 10.7880 11.3662 14.8903 14.1807与原来的数据相较:0.62

13、5 1.125 2.125 2.75 7.625 8.875 11.25 12.75 16 19.375六:模型的改进:不容易看出哪一个是白南瓜。由于无法辨认出白南瓜且置信区间都为负的且所得的结果和真实数据之间还存在一定的误差,为使模型更加完善,现在可进一步进行改善。由于x2与x3的本质是一样的,所以将两者取算术平均,重新拟合:程序:clearH=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85

14、86 97.5 93.3;scatter(x3+x2)./2,H) 所得的图如下: 图六:重新拟合此曲线可由模型:H=a0+a1*(x2+x3)./2+a2*(x2+x3)./2).2+b拟合;接下来讨论改进的方法:可以添加交互项。本题添加交互项为H=a0+a1x4+a2*x42+a3*x1+a4*(x2+x3)./2+a5*(x2+x3)./2).2+a6*x1*(x2+x3)./2+x7*x1*x4+a8*(a2+a3)./2*a4求解;程序: clearx1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2;x2=19.2 26.5 29 42.3 48

15、.8 66 88 81 99.5 89.8;x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3;x4=22.8 30.4 31.1 50 46 66 66 85 83.7 101.2;H=0.25 0.6 0.75 2.4 2.8 7 10.1 12.5 16.9 17.2;n=10;X=ones(n,1),x1,x12,(x2+x3)./2,(x2+x3)./2).2,x4,x4.2,x1.*(x2+x3)./2,x4.*(x2+x3)./2;b,bint,r,rint,s=regress(w,X,0.05); b,bint,s, rcoplot

16、(r,rint)b= 1.3138 0.9004 0.0272 -0.6945 0.0082 0.3262 -0.0068 -0.0334 0.0089bint = -0.6447 -1.6602 -0.4907 -2.2552 -0.0096 -0.4602 -0.0600 -0.3468 -0.0926 3.2722 3.4610 0.5451 0.8662 0.0261 1.1126 0.0463 0.2800 0.1104s=1.0e+004 0.0001 4.7019 0.0000图七:残差分析结果分析:与前一个模型相比较虽然回归系数的置信区间仍然为负,没有达到预期的效果,但是模型已

17、经得到明显的优化,具有体现在以下几个方面:R2和F的值都增加了且p的值减少,这说明因变量和自变量之间有更强的相关性;另一方面由时序残差图可以看出改进后的模型奇异点。 此优化方案是将原来的模型化为二次线性回归方程来处理。模型的检验:程序: clear x1=4 6 7.5 9.7 14.7 19.7 31.2 24.7 32.7 23.2 23.5; x2=19.2 26.5 29 42.3 48.8 66 88 81 99.5 89.8 101.5; x3=19.3 26.4 28.7 42.5 48.8 66.5 85 86 97.5 93.3 93; x4=22.8 30.4 31.1 5

18、0.46 66 66 85 83.7 101.2 94.5; H=1.3138+0.9004.*x1+0.0272.*x1.2-0.6945.*(x2+x3)./2+0.0082.*(x2+x3)./2).2+0.3262.*x4-0.0068.*x4.2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2结果:H= 0.2569 0.5505 0.7118 2.3430 2.6988 6.8199 9.7426 12.2087 16.4519 23.0671模型应用:(辨别白南瓜)程序: clear x1=7.4 8.1 8.4 12.5 18 21

19、19 26.5 25.4; x2=27.5 35.8 42 46 66 72.5 79 89 89; x3=27 35.5 41.7 46 64.5 73.5 81 90 89.5; x4=27.8 41 50.5 47.5 67.5 74.6 85.8 78.3 90.1;H=1.3138+0.9004.*x1+0.0272.*x1.2-0.6945.*(x2+x3)./2+0.0082.*(x2+x3)./2)2+0.3262.*x4-0.0068.*x4.2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2结果: H = 0.4503 1.361

20、6 2.9270 2.6165 6.9363 8.9736 13.4110 14.8067 15.1065模型的分析:将以上两种方法的结果与2003年,2004年的数据相比较:2003年的数据相对比:改进之前的结果改进之后的结果原始数据0.53080.25690.250.39380.55050.60.74660.71180.751.96502.34302.42.88202.69882.87.29726.8199711.05239.742610.113.493212.208612.515.706616.451916.917.615216.875917.2从对比表中可以看出优化以后的数据比之前的数

21、据更加的接近原始数据,所以改进以后的模型更优。 2004年的数据对比:改进之前的数据改进以后的数据原始数据0.72320.45030.6250.84551.36161.1251.38282.29272.1252.40262.61652.756.83706.93637.6259.45168.97368.87510.788013.411811.2511.366214.806712.7514.890315.10651614.180723.067119.375对比与表格中的数据可以看出第十组的数据差异比较大,所以可以判定第十个南瓜是白南瓜,其他的为黄南瓜。七:模型评价:此模型采用回归分析的方法,利用matlab进行数据求解。在对此模型进行模型改进的过程中,采用的是化为二次线性回归方程求解,在模型的建立于优化的=过程中,此模型中对于回归系数的估计不是很好,回归系数的置信区间都包含零点。模型有待于进一步的修正。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1