数学建模之南瓜称重问题.docx

上传人:b****5 文档编号:7480177 上传时间:2023-01-24 格式:DOCX 页数:14 大小:98.22KB
下载 相关 举报
数学建模之南瓜称重问题.docx_第1页
第1页 / 共14页
数学建模之南瓜称重问题.docx_第2页
第2页 / 共14页
数学建模之南瓜称重问题.docx_第3页
第3页 / 共14页
数学建模之南瓜称重问题.docx_第4页
第4页 / 共14页
数学建模之南瓜称重问题.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

数学建模之南瓜称重问题.docx

《数学建模之南瓜称重问题.docx》由会员分享,可在线阅读,更多相关《数学建模之南瓜称重问题.docx(14页珍藏版)》请在冰豆网上搜索。

数学建模之南瓜称重问题.docx

数学建模之南瓜称重问题

数学建模之南瓜估重问题

摘要

不用天平称量南瓜的重量,如何仅通过南瓜的大小尺寸来估计南瓜的重量。

本案例是在根据连续两年的对于一定数量的南瓜高度,水平长度,垂直方向与相应的重量的数据收集,在此基础上,我们建立回归分析方程模型,找出南瓜重量与其他各数据量之间的关系如下

H=1.3138+0.9004.*x1+0.0272.*x1.^2-0.6945.*(x2+x3)./2+0.0082.*((x2+x3)./2)^2+0.3262.*x4-0.0068.*x4.^2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2。

应用软件找出所给各数据项与重量之间的散点图,找出之间的关系。

说明哪些变量是重要的变量,根据之间的关系建立模型,对于模型进行检验可知该模型的缺点。

再对于所做的模型进行优化,运用化为二次多项式回归的方法,进行模型改进。

应用2003年的数据进行模型的建立与验算,同时应用2004年的数据进行模型的求解,由此求出哪个不是黄南瓜。

关键词:

南瓜称重回归分析高度水平长度垂直方向

一﹑问题的重述与分析

1.1问题的重述

不用天平估计南瓜重量是某些农村居民在秋天一种常见的竞赛,能否仅通过某些南瓜的尺寸预测出南瓜的重量呢!

现给出以往对于一堆南瓜的尺寸数据与相应的重量数据。

根据这些数据资料,利用数学建模的方法,在信息不足的条件下,提出以量化分析为基础的根据尺寸数据对于南瓜重量分析的估计方法,给出一个明确的数学公式,并对于模型进行分析。

1.2问题的分析

在此次的建模过程中主要用到回归分析方法,预测一个南瓜的重量与许多因素有关,而这些因素往往又相互制约,如果要确立估计一个南瓜的重量函数关系就必须找出重量与各因素之间的关系。

可以利用matlab分析软件对于各数据之间的关系进行描述,然后确立因变量与自变量之间的函数关。

二﹑基本假设

1.重量的估计只与南瓜的高度水平长度垂直方向1垂直方向2四个变量有关。

2.在一定范围之内的误差是可以忽略不急的。

3.所给数据是随机产生的,具有一定的代表性。

三﹑符号约定

X1:

南瓜的高度

X2:

南瓜的垂直方向2

X3:

南瓜的垂直方向1

X4:

南瓜的水平长度

H:

南瓜的重量

四﹑模型的建立

首先必须讨论所给的数据:

高度水平长度垂直方向1垂直方向2与重量之间的关系。

由此,所以第一步需要根据matlab画出各数据之间的散点图,进而确定哪些是重要的变量,进而写出函数关系。

(1)重量与高度

程序:

>>clear

>>x1=[467.59.514.719.731.224.732.723.2];

>>H=[0.250.60.752.42.8710.112.516.917.2];

>>scatter(x1,H)

图像如下:

图一

(2)重量与水平长度

程序:

>>clear

>>H=[0.250.60.752.42.8710.112.516.917.2];

>>x4=[22.830.431.1504666668583.7101.2];

>>scatter(x4,H)

图像如下:

图二

(3)重量与垂直方向1

程序:

>>clear

>>H=[0.250.60.752.42.8710.112.516.917.2];

>>x3=[19.326.428.742.548.866.5858697.593.3];

>>scatter(x3,H)

图像如下:

图三

(4)重量与垂直方向2

程序:

>>clear

>>H=[0.250.60.752.42.8710.112.516.917.2];

>>x2=[19.226.52942.348.866888199.589.8];

>>scatter(x2,H)

图像如下:

图四

从图2与图1可以发现,随着x4和x1的增加,H的值有向上弯曲的增加趋势,而且可以观察到图2的曲线经过原点的,所以图中的曲线可以分别用两条曲线模拟:

曲线1:

H=a1*x4+a2*x4^2+b

曲线2:

H=a0+a1*x1+a2*x1^2

而图3,4中,当x3和x2增加时,H的值有明显的线性增长趋势,图中的散点用直线连起来以后会发现,可以发现可用两条直线来模拟:

直线1:

H=a0+a1*x3+b

直线2:

H=a0+a1*x2+b

综上所述,可以结合以上四个模型建立回归模型:

H=a0+a1*x4+a2*x4^2+a3*x1+a4*x1^2+a5*x3+a6*x2+b

(其中a0,a1,a2,a3,a4,a5,a6为常数,b是随机误差)

五:

模型的求解:

现在可利用2003年有关南瓜的相关数据来进行模型求解。

直接利用MATLAB来进行求解,求解过程及结果如下:

程序:

>>clear

>>x1=[467.59.714.719.731.224.732.723.2]';

>>x2=[19.226.52942.348.866888199.589.8]';

>>x3=[19.326.428.742.548.866.5858697.593.3]';

>>x4=[22.830.431.1504666668583.7101.2]';

>>H=[0.250.60.752.42.8710.112.516.917.2];

>>n=10;

>>X=[ones(n,1),x1,x1.^2,x2,x3,x4,x4.^2];

>>[b,bint,r,rint,s]=regress(H',X,0.05);

>>b,bint,s,

>>rcoplot(r,rint)

结果:

b=

1.0334

-0.1556

0.0103

0.1022

-0.1242

-0.0386

0.0020

 

bint=

-7.91189.9786

-5.00984.6985

-0.01040.0311

-0.61300.8174

-2.97382.7253

-1.39541.3183

-0.00150.0055

 

s=

0.9954108.99830.00130.6184

程序说明:

语句>>X=[ones(n,1),x1,x1.^2,x2,x3,x4,x4.^2];表示一个向量矩阵,其中ones(n,1)生成一个n行1列的元素全为1的矩阵。

语句[b,bint,r,rint,s]=regress(H',X,0.05);中bint是回归系数的置信区间,r是残差(;列向量),rint是残差的置信区间,s包含3个统计量:

决定系数R^2(相关系数为R);F值;F(1,n-2)分布大于F值的概论p。

语句>>rcoplot(r,rint)

生成一个残差图,即下图:

图五:

残差分析

结果分析:

由结果可得,R^2=0.9954在0.8到1之间,可以判断回归自变量具有较强的线性相关性;此模型中F的值要比F(1,n-2)大得多,同样也表现出两者具有较强的线性相关性;p小于显著水平0.05,所以所得的模型有用。

模型检验:

将2003年的数据带入模型中进行检验

程序有:

clear

x1=[467.59.714.719.731.224.732.723.2]';

x2=[19.226.52942.348.866888199.589.8]';

x3=[19.326.428.742.548.866.5858697.593.3]';

x4=[22.830.431.1504666668583.7101.2]';

H=x1.*0.6255-2.9611.*sqrt((x2+x3)./2)+0.0021.*x4.^2+9.9289

结果:

H=

0.5308

0.3938

0.7466

1.9650

2.8820

7.2972

11.0523

13.4932

15.7066

17.6152

模型结果基本与数据相符,所以可以认为此模型是有效的。

模型的应用:

根据题目的要求将2004年的数据带入到模型中,辨认出其中的白南瓜是哪一个。

程序:

>>clear

>>x1=[7.48.18.412.518211926.525.423.5]';

>>x2=[27.535.842466672.5798989101.5]';

>>x3=[2735.541.74664.573.5819089.593]';

>>x4=[27.84150.547.567.574.685.878.390.194.5]';

>>H=x1.*0.6255-2.9611.*sqrt((x2+x3)./2)+0.0021.*x4.^2+9.9289

结果:

H=

0.7232

0.8455

1.3828

2.4026

6.8370

9.4516

10.7880

11.3662

14.8903

14.1807

与原来的数据相较:

0.6251.1252.1252.757.625

8.87511.2512.751619.375

六:

模型的改进:

不容易看出哪一个是白南瓜。

由于无法辨认出白南瓜且置信区间都为负的且所得的结果和真实数据之间还存在一定的误差,为使模型更加完善,现在可进一步进行改善。

由于x2与x3的本质是一样的,所以将两者取算术平均,重新拟合:

程序:

clear

H=[0.250.60.752.42.8710.112.516.917.2];

x2=[19.226.52942.348.866888199.589.8];

x3=[19.326.428.742.548.866.5858697.593.3];

scatter((x3+x2)./2,H)

所得的图如下:

图六:

重新拟合

此曲线可由模型:

H=a0+a1*(x2+x3)./2+a2*((x2+x3)./2).^2+b拟合;接下来讨论改进的方法:

可以添加交互项。

本题添加交互项为

H=a0+a1x4+a2*x4^2+a3*x1+a4*(x2+x3)./2+a5*((x2+x3)./2).^2+a6*x1*(x2+x3)./2+x7*x1*x4+a8*(a2+a3)./2*a4

求解;

程序:

>clear

x1=[467.59.714.719.731.224.732.723.2]';

x2=[19.226.52942.348.866888199.589.8]';

x3=[19.326.428.742.548.866.5858697.593.3]';

x4=[22.830.431.1504666668583.7101.2]';

H=[0.250.60.752.42.8710.112.516.917.2];

n=10;

X=[ones(n,1),x1,x1^2,(x2+x3)./2,((x2+x3)./2).^2,x4,x4.^2,x1.*(x2+x3)./2,x4.*(x2+x3)./2];

[b,bint,r,rint,s]=regress(w',X,0.05);b,bint,s,rcoplot(r,rint)

b=1.3138

0.9004

0.0272

-0.6945

0.0082

0.3262

-0.0068

-0.0334

0.0089

bint=-0.6447-1.6602-0.4907-2.2552-0.0096-0.4602-0.0600-0.3468-0.09263.27223.46100.54510.86620.02611.11260.04630.28000.1104

s=1.0e+004

0.00014.70190.0000

图七:

残差分析

结果分析:

与前一个模型相比较虽然回归系数的置信区间仍然为负,没有达到预期的效果,但是模型已经得到明显的优化,具有体现在以下几个方面:

R^2和F的值都增加了且p的值减少,这说明因变量和自变量之间有更强的相关性;另一方面由时序残差图可以看出改进后的模型奇异点。

此优化方案是将原来的模型化为二次线性回归方程来处理。

模型的检验:

程序:

>>clear

>>x1=[467.59.714.719.731.224.732.723.223.5]';

>>x2=[19.226.52942.348.866888199.589.8101.5]';

>>x3=[19.326.428.742.548.866.5858697.593.393]';

>>x4=[22.830.431.150.4666668583.7101.294.5]';

>>H=1.3138+0.9004.*x1+0.0272.*x1.^2-0.6945.*(x2+x3)./2+0.0082.*((x2+x3)./2).^2+0.3262.*x4-0.0068.*x4.^2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2

结果:

H=

0.25690.55050.71182.34302.6988

6.81999.742612.208716.451923.0671

模型应用:

(辨别白南瓜)

程序:

>>clear

>>x1=[7.48.18.412.518211926.525.4]';

>>x2=[27.535.842466672.5798989]';

>>x3=[2735.541.74664.573.5819089.5]';

>>x4=[27.84150.547.567.574.685.878.390.1]';

>>H=1.3138+0.9004.*x1+0.0272.*x1.^2-0.6945.*(x2+x3)./2+0.0082.*((x2+x3)./2)^2+0.3262.*x4-0.0068.*x4.^2-0.0334.*x1.*(x2+x3)./2+0.0089.*x4.*(x2+x3)./2

结果:

H=

0.45031.36162.92702.6165

6.93638.973613.411014.806715.1065

模型的分析:

将以上两种方法的结果与2003年,2004年的数据相比较:

2003年的数据相对比:

改进之前的结果

改进之后的结果

原始数据

0.5308

0.2569

0.25

0.3938

0.5505

0.6

0.7466

0.7118

0.75

1.9650

2.3430

2.4

2.8820

2.6988

2.8

7.2972

6.8199

7

11.0523

9.7426

10.1

13.4932

12.2086

12.5

15.7066

16.4519

16.9

17.6152

16.8759

17.2

从对比表中可以看出优化以后的数据比之前的数据更加的接近原始数据,所以改进以后的模型更优。

2004年的数据对比:

改进之前的数据

改进以后的数据

原始数据

0.7232

0.4503

0.625

0.8455

1.3616

1.125

1.3828

2.2927

2.125

2.4026

2.6165

2.75

6.8370

6.9363

7.625

9.4516

8.9736

8.875

10.7880

13.4118

11.25

11.3662

14.8067

12.75

14.8903

15.1065

16

14.1807

23.0671

19.375

对比与表格中的数据可以看出第十组的数据差异比较大,所以可以判定第十个南瓜是白南瓜,其他的为黄南瓜。

七:

模型评价:

此模型采用回归分析的方法,利用matlab进行数据求解。

在对此模型进行模型改进的过程中,采用的是化为二次线性回归方程求解,在模型的建立于优化的=过程中,此模型中对于回归系数的估计不是很好,回归系数的置信区间都包含零点。

模型有待于进一步的修正。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1