第八章统计回归模型.docx

资源描述

第八章统计回归模型.docx

《第八章统计回归模型.docx》由会员分享，可在线阅读，更多相关《第八章统计回归模型.docx（24页珍藏版）》请在冰豆网上搜索。

第八章统计回归模型.docx

第八章统计回归模型

回归分析是研究一个变量

与其它若干变量

之间相关关系的一种数学工具.它是在一组试验或观测数据的基础上，寻找被随机性掩盖了的变量之间的依存关系.粗略的讲，可以理解为用一种确定的函数关系去近似代替比较复杂的相关关系.这个函数称为回归函数.

回归分析所研究的主要问题是如何利用变量

、

的观察值（样本），对回归函数进行统计推断，包括对它进行估计及检验与它有关的假设等.

回归分析包含的内容广泛.此处将讨论多项式回归、多元线性回归、非线性回归以及逐步回归.

一、多项式回归

（1）一元多项式回归

一元多项式回归模型的一般形式为

如果从数据的散点图上发现

与

呈现较明显的二次（或高次）函数关系，则可以选用一元多项式回归.

1.用函数polyfit估计模型参数，其具体调用格式如下：

p=polyfit（x,y,m）p返回多项式系数的估计值；m设定多项式的最高次数；x，y为对应数据点值.

[p,S]=polyfit（x,y,m）S是一个矩阵，用来估计预测误差.

2.输出预估值与残差的计算用函数polyval实现，其具体调用格式如下：

Y=polyval（p,X）求polyfit所得的回归多项式在X处的预测值Y.

[Y,DELTA]=polyval（p,X,S）p，S为polyfit的输出，DELTA为误差估计.在线性回归模型中，Y±DELTA以50%的概率包含函数在X处的真值.

3.模型预测的置信区间用polyconf实现，其具体调用格式如下：

[Y,DELTA]=polyconf（p,X,S,alpha）求polyfit所得的回归多项式在X处的预测值Y及预测值的显著性为1-alpha的置信区间Y±DELTA，alpha缺省时为.

4.交互式画图工具polytool，其具体调用格式如下：

polytool（x,y,m）；

polytool（x,y,m,alpha）；

用m次多项式拟合x，y的值，默认值为1，alpha为显著性水平，默认值为.

例1观测物体降落的距离s与时间t的关系，得到数据如下表，求s.

t（s）

1/30

2/30

3/30

4/30

5/30

6/30

7/30

s（cm）

t（s）

8/30

9/30

10/30

11/30

12/30

13/30

14/30

s（cm）

解根据数据的散点图，应拟合为一条二次曲线.选用二次模型，具体代码如下：

%%%输入数据

t=1/30:

1/30:

14/30;

s=[];

%%%多项式系数拟合

[p,S]=polyfit（t,s,2）;

则得回归模型为：

%%%y的拟合值及预测值y的置信半径delta

[y,dalta]=polyconf（p,t,S）;

得结果如下：

Columns1through11

Columns12through14

dalta=

Columns1through11

Columns12through14

%%%交互式画图

polytool（t,s,2）;

polytool所得的交互式图形如图8-1所示.

图8-1

（2）多元二项式回归

多元二项式回归模型的一般形式为

多元二项式回归命令：

rstool（x,y,’model’,alpha）x表示nm矩阵；y表示n维列向量；alpha为显著性水平（缺省时为；model表示由下列4个模型中选择1个（用字符串输入，缺省时为线性模型）：

linear（线性）：

；

purequadratic（纯二次）：

；

interaction（交叉）：

；

quadratic（完全二次）：

例2设某商品的需求量与消费者的平均收入、商品价格的统计数据如下，建立回归模型，预测平均收入为1000、价格为6时的商品需求量.

需求量

100

110

收入

1000

600

1200

500

300

400

1300

1100

1300

300

价格

解选择纯二次模型，即

%%%输入数据

x1=[10006001200500300400130011001300300];

x2=[5766875439];

x=[x1'x2'];

y=[10075807050659010011060]';

%%%多元二项式回归

rstool（x,y,'purequadratic'）;

得如下结果：

图8-2

得到一个如图所示的交互式画面，左边是x1（=1000）固定时的曲线y（x1）及其置信区间，右边是x2（=6）固定时的曲线y（x2）及其置信区间.用鼠标移动图中的十字线，或在图下方窗口内输入，可改变x1，x2.在左边图形下方的方框中输入1000，右边图形下方的方框中输入6，则画面左边的“PredictedY1”下方的数据变为，即预测出平均收入为1000、价格为6时的商品需求量为.

在画面左下方单击”Export”，在出现的窗体中单击”ok”按钮，则beta、rmse和residuals都传送到Matlab工作区中.

在Matlab工作区中输入命令：

beta,rmse，得结果：

beta=

rmse=

故回归模型为：

，

剩余标准差为，说明此回归模型的显著性较好.

二、多元线性回归

多元线性回归模型的一般形式为

在Matlab统计工具箱中使用函数regress实现多元线性回归.具体调用格式为：

b=regress（Y,X）

[b,bint,r,rint,stats]=regress（Y,X,alpha）

其中

，

.对于一元线性回归，取

即可.b为输出向量；b，bint表示回归系数估计值和它们的置信区间；r表示残差；rint表示残差的置信区间；stats表示用于检验回归模型的统计量，有四个数值：