多元线性回归分析法.docx

上传人:b****2 文档编号:1599916 上传时间:2022-10-23 格式:DOCX 页数:9 大小:134.53KB
下载 相关 举报
多元线性回归分析法.docx_第1页
第1页 / 共9页
多元线性回归分析法.docx_第2页
第2页 / 共9页
多元线性回归分析法.docx_第3页
第3页 / 共9页
多元线性回归分析法.docx_第4页
第4页 / 共9页
多元线性回归分析法.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

多元线性回归分析法.docx

《多元线性回归分析法.docx》由会员分享,可在线阅读,更多相关《多元线性回归分析法.docx(9页珍藏版)》请在冰豆网上搜索。

多元线性回归分析法.docx

多元线性回归分析法

 

软测量技术与应用

 

院-系:

信息工程与自动化学院

专业:

模式识别与智能系统

年级:

2011级

学生姓名:

**

学号:

****

任课教师:

冯老师

 

2012年6月26日

多元线性回归分析法预测商品零售价格

一、引言

在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。

而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。

例如,某一商品的零售价格既与人口的增长变化有关,也与商品的销售量有关。

这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。

二、多元线性回归分析法介绍

多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

1.1多元线性回归的计算模型

 设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:

其中,为常数项,为回归系数,为固定时,每增加一个单位对y的效应,即对y的偏回归系数;同理b2为固定时,每增加一个单位对y的效应,即对y的偏回归系数,等等。

如果两个自变量同一个因变量y呈线相关时,可用二元线性回归模型描述为:

建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

 

(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

  (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;

  (4)自变量应具有完整的统计数据,其预测值容易确定。

1.2多元线性回归模型的检验

多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。

  

(1)拟合程度的测定。

与一元线性回归中可决系数相对应,多元线性回归中也有多重可决系数,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。

计算公式为:

其中,=

=

(2)回归方程的显著性检验

 回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。

通常采用F检验,F统计量的计算公式为

根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值,若,则回归方程具有显著意义,回归效果显著;,则回归方程无显著意义,回归效果不显著。

三、模型的假设与说明

2.1模型的假设

(1)在理想情况下,价格指数问题只与给出的因素——利率、消费水平有关,我们只选取了一小部分而与其他部分无关。

(2)社会的发展平衡稳定,排除突发事件导致数据的突变。

(3)假设因素之间的联系较小,不存在一个因素的变化导致其他因素的剧烈变化。

(4)所给数据真实据可靠,反应实际情况。

2.2数据来源说明

表1各因素统计表(数据来源:

2008中国统计年鉴)

年份

1990

1991

1992

1993

1994

1995

1996

1997

1998

年利率

9.36

7.56

7.56

10.08

10.08

10.08

8.32

5.67

4.59

消费水平

229.2

249.0

282.0

305.8

320.0

345.1

377.6

394.6

417.8

商品零售价格指数

207.7

213.7

225.2

254.9

310.2

356.1

377.8

380.8

370.9

年份

1999

2000

2001

2002

2003

2004

2005

2006

2007

年利率

2.25

2.25

2.25

1.98

1.98

2.25

2.25

2.52

3.46

消费水平

452.3

491.0

518.8

552.5

588.5

632.3

682.3

747.8

824.1

商品零售价格指数

359.8

354.4

351.6

347.0

346.7

356.4

359.3

362.9

376.7

年利率——根据我国各大银行,人民银行、建设银行的随即的记录结果进行的数据处理得

到,一年中利率的调整粗略的取其均值。

商品零售价格指数——价格指数编制由国家统计局城市社会经济调查司组织实施。

资料采

用抽样调查和重点调查相结合的方法取得,即在全国选择不同经济

区域和分布合理的地区,以及有代表性的商品作为样本,对其市场

价格进行定期调查,以样本推断总体。

商品零售价格指数的计算权

数主要根据社会商品零售额资料确定。

居民消费水平——其调查按类别分,计算权数根据近12万户城乡居民家庭消费支出构成确

定。

四、模型的建立与求解

Matlab上的散点图程序如下:

>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,

3.46];

>>x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,

632.3,682.3,747.8,824.1];

>>y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,

356.4,359.3,362.9,376.7];

>>subplot(2,1,1);plot(x1,y,'*');subplot(2,1,2);plot(x2,y,'+')

运行结果如图1所示:

图1散点图

由图可知:

y与有较明显的线性关系,而y与则难以确定,做几种尝试,用统计分析决定优劣。

设多元线性回归模型为

为1990-2007年的利率,为1990-2007年的消费水平,y为商品零售价格指数。

模型求解的MATLAB程序如下:

>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,

3.46];

>>x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,

632.3,682.3,747.8,824.1];

>>y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,

356.4,359.3,362.9,376.7];

>>x=[ones(18,1)x1'x2'];

>>[b,bint,r,rint,stats]=regress(y',x)

b=

251.2424

-2.2754

0.1908

bint=

91.9188410.5661

-14.12359.5727

-0.03200.4136

r=

-65.9753

-67.8489

-62.6452

-31.7521

20.8385

61.9495

73.4439

67.1705

50.3865

27.3796

14.5957

6.4915

-5.1527

-12.3214

-10.3640

-17.0038

-25.2867

-23.9057

rint=

-153.091921.1412

-155.209619.5119

-153.330528.0401

-123.714160.2099

-71.7544113.4315

-23.4503147.3494

-15.1859162.0737

-25.5579159.8989

-44.8588145.6319

-64.4279119.1870

-80.7849109.9763

-90.5133103.4964

-102.432792.1274

-110.031585.3887

-108.266887.5388

-112.803378.7956

-115.303264.7298

-98.838951.0276

stats=

0.44355.97710.0123

参数回归结果为,对应的置信区间分别为[91.9188,410.5661]、[-14.1235,9.5727]和[-0.0320,0.4136]。

其中:

b为回归系数估计值;bint为置信区间;stats包括判定系数,显著性检验F,概率p;r为残差;rint为置信区间。

其中判定系数是衡量拟合优度的一个重要指标,它的取值介于0与1之间,越接近于1,拟合度越好,反之越差。

五、结果分析与预测

接上面的程序继续在Matlab中输入指令:

>>rcoplot(r,rint)

>>set(gca,'Color','w');

可得到残差图如图2所示:

图2残差图

从残差图可以看出,数据的残差基本上离零点均较近,且残差的置信区间均包含零点,这说明回归模型能较好的符合原始数据。

对于若干组具体的数据,都可算出回归系数a,b,从而得到回归方程。

至于y与x之间是否真的有如回归模型所描述的关系,或者说用所得到的回归模型去拟合实际数据是否有足够好的近似,并不知道。

所以必须对模型进行检验。

用上述拟合结果,得到F=5.9771,现在取f=n−2=16;取显著性水平∂为0.05,查表可得相应的F分布临界值为,显然有,F检验通过,所以可以用前面的回归方程来描述年利率及消费水平与商品零售价格指数的关系,置信度为95%。

根据以下程序及图得到商品零售价格指数:

>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,

3.46];

>>x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,

632.3,682.3,747.8,824.1];

>>y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,

356.4,359.3,362.9,376.7]';

>>x=[x1',x2'];

>>rstool(x,y,'linear')

图3分析与预测

由此可知:

下一年的商品零售价格指数的置信区间为:

[293.5238,363.3762]

.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机软件及应用

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1