实验13回归分析报告报告材料.docx

上传人:b****2 文档编号:12664638 上传时间:2023-04-21 格式:DOCX 页数:18 大小:723.18KB
下载 相关 举报
实验13回归分析报告报告材料.docx_第1页
第1页 / 共18页
实验13回归分析报告报告材料.docx_第2页
第2页 / 共18页
实验13回归分析报告报告材料.docx_第3页
第3页 / 共18页
实验13回归分析报告报告材料.docx_第4页
第4页 / 共18页
实验13回归分析报告报告材料.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

实验13回归分析报告报告材料.docx

《实验13回归分析报告报告材料.docx》由会员分享,可在线阅读,更多相关《实验13回归分析报告报告材料.docx(18页珍藏版)》请在冰豆网上搜索。

实验13回归分析报告报告材料.docx

实验13回归分析报告报告材料

实验13回归分析

【实验目的】

1.了解回归分析的基本原理,掌握MATLAB实现的方法;

2.练习用回归分析解决实际问题。

【实验内容】

【题目2】

电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。

每周收入

96

90

95

92

95

95

94

94

电视广告费用

1.5

2.0

1.5

2.5

3.3

2.3

4.2

2.5

报纸广告费用

5.0

2.0

4.0

2.5

3.0

3.5

2.5

3.0

2.1模型分析

本题研究电视广告费用与报纸广告费用对电影收入的影响。

我们首先尝试线性回归,由R2值判断回归模型是否合理。

如果不合理,再采取其他方法进行回归分析。

设电视广告费用为

,报纸广告费用为

,每周电影院收入为y。

建立如下模型:

2.2matlab求解

y=[9690959295959494];

x1=[1.52.01.52.53.32.34.22.5];

x2=[5.02.04.02.53.03.52.53.0];

n=8;m=2;

X=[ones(8,1),x1',x2'];

[b,bint,r,rint,s]=regress(y',X);

b,bint,s

rcoplot(r,rint)

得到如下结果:

b=

83.2116

1.2985

2.3372

bint=

78.805887.6174

0.40072.1962

1.48603.1883

s=

0.908924.94080.00250.4897

整理成表格如下:

回归系数

回归系数估计值

回归系数置信区间

β0

83.2116

[78.805887.6174]

β1

1.2985

[0.40072.1962]

β2

2.3372

[1.48603.1883]

R2=0.9089,F=24.9408,p=0.0025,s2=0.4897

在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。

残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。

2.3剔除点后重新计算

删除第一个点后重新计算,将输出结果同样以表格表示。

回归系数

回归系数估计值

回归系数置信区间

β0

81.4881

[78.787884.1883]

β1

1.2877

[0.79641.7790]

β2

2.9766

[2.32813.6250]

R2=0.9768,F=84.3842,0.0005,s2=0.1257

剔除第一个异常点后,R2=0.97685,相比之前有了增加,拟合的线性性有了提高;相比之前的模型,p值也有了明显的减少,远小于显著性水平α,这表示置信概率大大提高了;s2也有了减小,说明了偏差减小。

综合以上几点,说明这个二元线性的模型比较合理,回归效果很好。

拟合公式为y=81.4881+1.2877x1+2.9766x2

2.4小结

本题是个较为直观的线性回归题,在它的计算中出现了异常点。

剔除后计算可以得到一个回归效果相当好的模型。

【题目8】

汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料如表,其中

是普通型汽车售量(千辆),

是豪华型汽车售量(千辆),

是汽油价格(元/gal),

是贷款利率(%)

(1)对普通型和豪华型汽车分别建立如下模型:

给出

的估计值和置信区间,决定系数

值及剩余方差等。

(2)用

表示汽车类型,建立统一模型

,给出给出

的估计值和置信区间,决定系数

值及剩余方差等。

带入统一模型,将结果与

(1)的两个模型的结果比较,解释二者的区别。

(3)对统一模型就每种类型汽车分别作

与残差的散点图,有什么现象,说明模型有何缺陷?

(4)对统一模型增加二次项和交互相,考察结果有什么改进。

8.1根据模型分别求解

由题意,对普通型和豪华型汽车分别建立如下模型:

此为二元线性回归,可用matlab编写程序如下:

y1=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3];

y2=[7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];

x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];

x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];

n=18;m=2;

X=[ones(n,1),x1',x2'];

[b1,bint1,r1,rint1,s1]=regress(y1',X);

[b2,bint2,r2,rint2,s2]=regress(y2',X);

subplot(2,1,1)

rcoplot(r1,rint1)

subplot(2,1,2)

rcoplot(r2,rint2)

得到如下图:

在残差及置信区间的图中,有三个点的残差的置信区间不包含零点,以红色标出。

残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。

8.2剔除点后的模型求解

(1)对于

剔除第14、18个点后

继续自此基础上剔除第11个点

(2)对于

剔除第14个点后

继续剔除第七个点,得到残差及置信区间图如下:

将输出结果汇总成下表:

普通型

回归系数

回归系数估值

回归系数置信区间

107.5601

[75.3160139.8042]

-37.9283

[-57.2842-18.5723]

-3.0314

[-3.7862-2.2767]

R2=0.9334F=84.0758p<0.0001s2=9.2746

豪华型

回归系数

回归系数估值

回归系数置信区间

29.7583

[16.286443.2303]

-6.7738

[-14.97741.4299]

-1.6367

[-1.9680-1.3054]

R2=0.9450F=103.1152p<0.0001s2=1.5413

可得模型如下:

普通型:

y=107.5601-37.9283x1-3.0314x2

豪华型:

y=29.7583-6.7738x1-1.6367x2

8.3建立统一模型

建立统一模型

,用

表示普通型,

表示豪华型,此时为三元线性回归,可用matlab编写程序如下:

y=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];

x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];

x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];

x3=[zeros(1,18),ones(1,18)];

n=36;

m=3;

X=[ones(n,1),x1',x2',x3'];

[b,bint,r,rint,s]=regress(y',X);

b,bint,s

rcoplot(r,rint)

输出如下结果:

b=

64.5753

-16.1436

-2.3322

-14.4222

bint=

33.500795.6499

-35.11932.8320

-3.0705-1.5939

-17.6546-11.1898

s=

0.836654.61110.000022.6642

回归系数

回归系数估值

回归系数置信区间

64.5753

[33.500795.6499]

-16.1436

[-35.11932.8320]

-2.3322

[-3.0705-1.5939]

-14.4222

[-17.6546-11.1898]

可得模型为:

表示普通型,

表示豪华型。

即:

普通型:

豪华型:

可以看出:

统一模型相当于将分立模型进行了统一:

(1)统一模型的β值趋近于给分立模型的“平均”;

(2)统一模型的残差较大;

(3)统一模型的决定系数较小;

(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;

总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。

8.4就每种类型汽车分别作x1和x2与残差的散点图

y=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];

x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];

x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];

x3=[zeros(1,18),ones(1,18)];

n=36;

m=3;

X=[ones(n,1),x1',x2',x3'];

[b,bint,r,rint,s]=regress(y',X);

x11=x1(:

1:

18);

x22=x2(:

1:

18);

r1=r(1:

18,:

);

r2=r(19:

36,:

);

subplot(2,2,1)

plot(x11,r1,'r+')

title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx1µÄÉ¢µãͼ')

subplot(2,2,2)

plot(x22,r1,'r+')

title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µãͼ')

subplot(2,2,3)

plot(x11,r2,'r+')

title('ºÀ»ªÐÍÆû³µ£º²Ð²îÓëx1µÄÉ¢µãͼ')

subplot(2,2,4)

plot(x22,r2,'r+')

title('ºÀ»ªÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µãͼ')

得到如下图形

对比以上各图,发现针对同一变量(

),两种类型汽车所得的残差变化趋势不一致,说明

有交互作用,即模型的缺陷是缺少二次项和交互项。

8.5对统一模型增加二次项和交互相进行回归

(1)增加交互项,改用模型:

进行回归分析

x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];

x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];

x3=[zeros(1,length(x1)),ones(1,length(x2))];

x1=[x1,x1];

x2=[x2,x2];

x1x2=x1.*x2;

x1x3=x1.*x3;

x2x3=x2.*x3;

x12=x1.*x1;

x22=x2.*x2;

y1=[22.1,15.4,11.7,10.3,11.4,7.5,13,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3];

y2=[7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];

X=[ones(length(x1),1),x1',x2',x3',x1x2',x2x3',x1x3'];

Y=[y1,y2];

[b,bint,r,rint,s]=regress(Y',X);

b,bint,s

得到如下结果:

b=

141.1004

-57.4368

-12.5875

-65.6343

5.3855

1.7923

23.0304

bint=

39.5625242.6383

-117.09702.2235

-30.29685.1218

-111.3383-19.9303

-4.795315.5663

0.70502.8796

-4.916650.9774

s=

0.920355.84740.000012.1906

发现R2、F和s2都有所改善,模型有效的概率也有所提高,但是x1,x2的置信区间都包含0,这应当是由于引入交互项x1x3和x2x3导致的。

(2)增加二次项

改用模型:

这里不增加x32是因为它和x3一样。

将程序改为

X=[ones(length(x1),1),x1',x2',x3',x12',x22'];

得到如下结果:

b=

-140.9671

217.3994

-6.0022

-14.4222

-62.6018

0.2625

bint=

-741.4504459.5163

-456.1560890.9548

-9.4626-2.5418

-17.5142-11.3302

-249.9892124.7856

0.00620.5187

s=

0.860637.02860.000020.6300

发现x1*x1的置信区间仍包含0点。

(3)综合

综合以上分析,建立如下模型:

将程序改为

X=[ones(length(x1),1),x1',x2',x3',x1x2',x2x3’,x22'];

输出结果如下:

b=

25.2153

17.5089

-0.3020

-28.2975

-4.2510

2.2850

0.3184

bint=

-88.5161138.9467

-51.935686.9533

-18.816118.2121

-33.8287-22.7662

-15.79907.2971

1.44873.1214

0.09560.5412

s=

0.932466.71850.000010.3384

拒绝模型的概率达到10的-15次方。

模型如下:

【实验总结】

这是本学期数学实验的最后一次作业,总体来说比较顺利。

这部分内容综合了之前学习过的优化以及统计推断的内容,是综合性较强的一部分,很好地帮助我复习了以前学习过的内容。

收获简要总结如下:

1、学习了回归分析相关知识,包括一元线性回归、多元线性回归以及非线性回归;

2、了解了残差分析、交互作用等内容;

3、学习了使用MATLAB进行回归分析的方法;

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1