ARIMA模型自回归移动平均模型.docx

上传人:b****8 文档编号:10790599 上传时间:2023-02-22 格式:DOCX 页数:15 大小:239.56KB
下载 相关 举报
ARIMA模型自回归移动平均模型.docx_第1页
第1页 / 共15页
ARIMA模型自回归移动平均模型.docx_第2页
第2页 / 共15页
ARIMA模型自回归移动平均模型.docx_第3页
第3页 / 共15页
ARIMA模型自回归移动平均模型.docx_第4页
第4页 / 共15页
ARIMA模型自回归移动平均模型.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

ARIMA模型自回归移动平均模型.docx

《ARIMA模型自回归移动平均模型.docx》由会员分享,可在线阅读,更多相关《ARIMA模型自回归移动平均模型.docx(15页珍藏版)》请在冰豆网上搜索。

ARIMA模型自回归移动平均模型.docx

ARIMA模型自回归移动平均模型

ARIMA模型自回归移动

平均模型

LELEwasfinallyrevisedonthemorningofDecember16,2020自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA)

D

什么是ARIMA模型

ARIMA模型全称为自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA),是由()和()于70年代初提出的一著名,所以又称为box-jenkins模型、博克思■詹金斯法。

其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。

ARIMA模型的基本思想

ARIMA模型的基本思想是:

将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的来近似描述这个序列。

这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值,现代统计方法、在某种程度上已经能够帮助企业对未来进行预测。

ARIMA模型预测的基本程序

(-)根据时间序列的、自相关函数和偏自相关函数图以ADF单位根检验其、趋势及其季节性变化规律,对序列的平稳性进行识别。

一股来讲,经济运行的时间序列都不是平稳序列。

(-)对非平稳序列进行平稳化处理。

如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。

(三)根据时间序列模型的识别规则,建立相应的模型。

若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合,

(四)进行,检验是否具有统计意义。

(五)进行,诊断残差序列是否为白噪声,

(六)利用已通过检验的模型进行。

相关链接

各国的box-jenkins模型名称

Glossaryofstatisticalterms

Language

Description

English

Box-Jenkinsmodel

French

modeledeBox-Jenkins

German

Box-Jenkins-Modell

Dutch

Box-Jenkins・model

Italian

modelloBox-Jenkins

Spanish

modelodeBox-Jenkins

Catalan

modeldeBox-Jenkins

Romanian

modelulBox-Jenkins

Finnish

Boxin-Jenkinsinmallit

Hungarian

Box-Jenkins-modell

Turkish

Box-Jenkinsmodeli

Estonian

Box-Jenkinsimudel

Lithuanian

BoxirJenkinsmodelis;BoksoirD之enkinsomodelis

Slovenian

Box-Jenkinsovamodel

Polish

modelBoxa-Jenkinsa

Russian

MoaenbBoKca-flxeHKUHca

Ukrainian

MOflenbBoKca・flxeHKiHca

Farsi

modeleBox-Jenkins

Persian-Farsi

Arabic

Afrikaans

Box-Jenkins・model

Chinese

博克斯一直金斯模型

ARIMA模型案例分析

案例一:

ARIMA模型在海关税收预测中的应用

2008年。

海关税收预算计划8400亿元.比2007年实际完成数增加%,比2007年预算数增加%。

为了对2008年江门海关税收总体形势进行把握,笔者尝试利用SAS软件的时间序列预测模块建立ARIMA模型,对2008年江门海关税收总值进行预测。

从预测结果来看,预测模型拟合度较高,预测值也切合实际情况,预测模型具有一定的应用价值;现将预测的方法、原理以及影响税收工作的相关因素分析:

一、ARIMA模型原理

ARIMA模型全称为自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA)。

是由博克思(Box)fFfl詹金斯(Jenkins)于70年代初提出的一著名时问序列预测方法,所以又称为box-jenkins模型、博克思一詹金斯法,其中ARIMA(p.称为差分自回归移动平均模型,AR是自回归,P为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数:

ARIMA模型可分为3种:

⑴自回归模型(简称AR模型);

(2)(简称MA模型);(3)(简称ARIMA模型)。

ARIMA模型的基本思想是:

将预测对象随时问推移而形成的数据序列视为一个随机序列.以时间序列的自相关分析为基础•用一定的来近似描述这个序列。

这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。

ARIMA模型在经济预测过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对于经济运行短期趋势的预测准确率较高,是近年应用比较广泛的方法之一。

二、应用ARIMA模型进行预测

每月税收数据•可以看作是随着时间的推移而形成的一个随机时间序列,通过对该时间序列上税款值的随机性、平稳性以及季节性等因素的分析,将这些单月税收值之间所具有的相关性或依存关系用数学模型描述出来,从而达到利用过去及现在的税收值信息来预测未来税收情况的目的。

(1)对序列取对数和作差分处理,形成稳定随机序列

ARIMA模型建模的基本条件是要求待预测的数列满足平稳的条件,即个体值要围绕序列均值上下波动,不能有明显的上升或下降趋势,如果出现上升或下降趋势,需要对原始序列进行差分平稳化处理;

2002-2007年江门海关月度税收图

从上图可看出,江门海关自2002年以来的实际入库税收值数列波动性较明显,且呈现出—定的上升趋势,不能直接用AHIMA模型进行建模。

取对数可以消除数据波动变大趋势,对数列进行一阶差分,可以消除数据增长趋势性和季节性。

从下图可以看出,预测数列取对数并作一阶差分后的图形显示基本消除了性的影响,趋于平稳化,满足ARIMA模型建模的基本要求。

2002-2007年江门海关月度税收值取对敷后厂阶整分8S

(二)模型参数的估计

时间序列预测模块的自相关分析包括对自和偏的分析,通过对比分析从而实现对时间序列特性的识别。

从计算结果可知,自相关函数1步截尾,偏自相关函数2步截尾,白相关函数通过白噪声检验n根据变换数列的自相关函数和偏自相关函数的特点,并经过反复测试,对ARIMA模型的参数进行估计.三个参数定为d=l,p=2和q=l。

对参数进行检验。

从检验结果可知,参数估计全部通过•拟合优度统计量表中给出了残差序列的方差和,以及按AIC和SBC标准计算的和,这两个值都较小,表明对预测模型拟合得较好。

从残差的自相关检验结果数据中•可以得知残差通过白噪声显著性检验。

预测模型最终形式为:

(1+Z=(1+B)u其中,Z=logXoB为后移算子,u为随机干扰项(三)应用模型预测。

利用上面确定的模型进行预测;预测模型2007年税收的拟合值是亿元,跟实际税收值亿元比较,误差为%,表明预测模型拟合度较高,预测模型具有一定的应用fir值。

把预测模型向前推12个月进行预测,得到2008年各月税收数据,全年累计税收预计均值为亿元,实际税收值会围绕此值上下波动。

需要说明的是,由于利用模型向前预测1—12月的数据,预测时间越长,难度越大,也下降,若到年中再次预测时,预测精度将会进一步提高。

这个税收预测值是基于当前水平、水平不变或提高的基础上,挖掘税收样本数据自身涵盖的信息•利用分析方法,建立预测模型得出的理论预测值,一旦实际外部环境和条件发生变化,例如国家实施、升值过快、大幅变动、对外的变化等,将对结果生一定的影响。

三、其他可能对2008年税收工作产生影响的主要因素

(一)个别商品税收变化影响巨大

2007年占关区税收总值80%前20位大类税源,与2006年占关区税收总值80%前20位大类税源商品相比,新增了大豆、印刷和装订机械及零件、棉纱线,少了空气调节器、初级形状的聚丙烯和初级形状的聚乙烯•新增的三项收总值为亿元。

占关区税收总值%,其中,大豆2007年税款高达亿元,2006年仅为15万元,影响巨大。

另外,煤和钢材的税收值大幅增长。

液化石油气、纺织品(包括服装和纺织纱线)、纸及纸板(未切成形的)税收下降幅度较大。

主要税源商品的不稳定,为关区税收工作增加了难度。

(二)本地企业异地纳税仍保持较大规模

据统计,2007年江门关区企业在异地进口应税货值亿元人民币,比2006年增长%,应征税收为亿元,较2006年增长%•占江门区同期应征税收总额的四成多。

从分布来看,大部分本地企业异地纳税进口行为分布在广州口岸。

在广州口岸纳税亿元,下降占异地纳税总值的%°另外。

在黄埔口岸纳税亿元,下降%;在拱北口岸纳税亿元,增加3倍从商品来看,异地纳税进口的商品主要是废塑料、废五金、木浆、冰乙酸、正丁醇、脂肪醇、冻猪杂碎、IEI挖掘机、初级形状聚乙烯等商品,税款均超过千万元,部分商品曾经在本关区口岸大量进口。

废塑料进口3亿元,下降%;废五金进口亿元,增长%;木浆进口7783万元,增长%;冰乙酸进口6593万元,下降%;正丁醇进口3498万元,增长倍;脂肪醇进口3366万元。

%;冻猪杂碎进口3313万元,増长倍;旧挖掘机进口3101万元,下隆%;初级形状聚乙烯进口2539万元,下降54%。

其中正丁醇、冻猪杂碎和废五金进口增长迅猛。

(三)主要纳税大户变化较大

2007年占关区税收总值60%前20位纳税企业,与2006年占关区税收总值60%前20位纳税企业相比,有12家企业新上榜,更新率为60%。

新增的2家纳税企业嘉吉投资(中国)和北京华特安科经贸有限公司共纳税亿元,占关区税收总值的15%。

影响巨大。

而海洋石油阳江实业有限公司的纳税额从2006年的亿元下降到2783万元,该企业的税款下fl手x,l2007年关区税收工作带来了较大的影响,主要纳税大户的不稳定,加大了2008年关区税收工作的不确定性。

(四)加工贸易内销补税和出口征税的影响

2007年,江门关区应征税收为亿元,增长%;内销补税(不含后续补税)为7909万元,增长%;后续补税为594万元,增长%o2007年江门关区品征税160万元,增长倍。

江门关区的税收以一般贸易进口征税为主,但由于进出口值占关区进出口总值的比重超过一半•因而加强加工贸易内销征税工作,充分挖掘加贸内销补税潜力,可以为关区税收总量增长提供支持:

虽然当前出口征税占关区税收总值的比重非常少,但由于国家不断调整外贸政策,2008年岀口需要征收商品涉及300多个税号,而且相当多的商品率高达15-20%,预计江门关区出口关税将会保持大幅增长态势,为关区税收总量增长提供补充:

综合来看,只要大类税源商品如己内酰胺、大豆、煤、钢材和废纸等保持2007年的进口规模,其他税源商品进口没有大幅下降,2008年的税收总额就能够保持甚至超过2007年的税收水平,如果液化石油气、纺织品和纸及纸板恢复2006年的进口水平,同时将本关区企业从异地报关引导回本关区,今年税收总额将比2007年小幅增长。

结合应用前面的时间序列模型的预测结果,综合多方面因素,预计全年累计税收均值为亿元。

案例二:

基于ARIMA模型的备件消耗预测方法

—、引言

随着技术的进步和军事的变革,快速响应战场需求是装备战斗力的重要指标之一。

要快速响应战场需求就要有强有力的后勤保障和支持,部队需要保证有一定数量备件。

而实际中却常常由于没有足够的备件导致装备不能快速形成战斗力。

由于造成备件短缺的重要原因是使用的备件需求预测方法和模型不够精确,故尝试用差分自回归滑动平均模型,即ARIMA(pdq)模型,对备件消耗进行预测,

1备件消耗预测的ARIMA(p,d,q)模型求和自回归滑动平均模型(AutoregressivelntegratedMovingAverageModel,简称ARIMA),由Box和Jenkins于70年代初提出的时间序列预测方法,又称为B-J模型、博克思-詹金斯法。

其中ARIMA(p,d,q)称为差分自回归滑动平均模型,AR是自回归,MA为滑动平均,p、q分别为对应的阶数,d为时间序列成为平稳时所做的差分次数:

1•基本思路

首先需要明确建立模型的前提是在预测的这段时间内,影响该类备件消耗量的主要因素不发生大变故,在此前提下,将备件消耗的历史视为一个时间序列,即为一组依赖于时间t的随机变量序列。

这些变量间有依存性和相关性,并表现出一定的规律性,如能根据这些消耗数据建立尽可能合理的统计模型,就能用这些模型来解释数据的规律性,就可利用已得到的备件消耗数据来预测未来消耗数据,也就能得出备件需求做好的备件供应:

2.模型描述

备件消耗预测ARIMA(pdq)模型实质是先对非平稳的备件消耗历史数据Yt进行d(d=

0,1,dots,n)次差分处理得到新的平稳的数据序列Xt,将Xt拟合ARMA(p,q)模型,然后再将原d次差分还原,便可以得到丫」的预测数据。

其中,ARMA(p?

q)的一般表达式为:

Xt=甲+・・・+WpX—p+饪一久牡_i一…•一thetaq€f^q)t€Z

式中,前半部分为自回归部分,非负整数p为自回归阶数,卩1厂・•®为自回归系数,后半部分为滑动平均部分,非负整数q为滑动平均阶数,久)…)为滑动平均系数;X,为备件消耗数据相关序列,&为WN(0e)。

当q=0时,该模型成为AR(p)模型:

Xt=qX—+…+甲pX—p+€川€2⑵

当P=o时,该模型成为MA(q)模型:

Xt=—01€t—1—…一t€Z

3•备件消耗预测建模流程

通过建立ARIMA(pdq)模型进行备件消耗预测的基本流程,如下图。

备件消耗预测建模流程

(1)获取数据并进行预处理•收集装备使用阶段某备件消耗的数据序列,记为

«,蜀,・利用游程检验法来判断该序列是否为平稳序列,如为非平稳序列,用差分

XH

I

差分所得数据可以通过平稳性检验,记为d次差分,得到新的平稳序列

取前N组(或全部)数据作为观测数据,进行零均值化处理,即:

得到一组预处理后的新序列人£o

(2)ARMA模型的识别

通过计算预处理后的序列兀的自相关函数(ACF)Ofc和偏自相关函数(PACF)0M来进行模

型识别。

具体的计算公式为:

011=Pl

亦十:

u:

十]=-刀;=1负汁i_j0A:

j)(l-倉0細)i

宓十1J=氛3一0屁十:

U:

十1臥:

&十l—jJ=2)•…,

根据上述计算结果,并依据表1的模型识别原则,可以确定符合的模型。

ARMA(p,q)模型识别原则

欖型

AR(p)

MA(q)

ARMA

自相关函数

拖尾.指数衰减或振荡

有限长度.磁尾(q步)

拖尾.指数衰减或振荡

偏自相关函数

有限长度.截尾(P步)

拖尾.指数衰减或振荡

拖尾.指数衰减或振荡

(3)参数估计和模型定阶

参数估计和模型定阶是建立备件消耗预测模型的重要内容,二者相互影响。

在上述模型识别的基础上,利用样本矩估计法、杲小二乘估计法或等对ARMA(p,q)的未知参数,即自回归系数、滑动平均系数以及白噪声方差进行估计,得出\widehat{\varphi}_1,\ldots,\widehat{\varphi}_p,\widehat{\theta}_1,\ldots,\widehat{\theta}_q,\widehat{\sigma}A2o

利用AIC、BIC准则进行模型定阶’具体步骤。

(4)模型检验

首先要检验所建立模型是否能满足平稳性和可逆性,既要求下式(6)、式(7)根在单位圆外,具体公式如下:

P,

炉(j?

)=1—刀pj®=0

/=1(6)

P

0(B)=1-=0

再进一步判断上述模型的残差序列是否为白噪声,如果不是,则需要重新进行模型识别,如果是,则通过检验,得出软件模型:

X;=+…+%+—旷1兔_1一…一Oq€t-q(8)

(5)备件消耗量预测

根据上述预测模型,依据一步预测的方法对X;进行预测,并考虑前面所进行的d次差

分,还原为备件消耗数据X的预测结果.根据该预测结果来进行备件的配置。

二、案例应用

1•原始数据及预处理

以航空兵场站某种航材备件3年的消耗率(件/1000h)来进行分析和预测。

取前30组数据建立模型,并用后面的几组数据对模型进行预测验证:

3年的原始数据的时间序列如下图,是有关备件消耗统计时间(2001年1月到2003年12月)-备件消耗率(件/1000h)的某航材备件消耗数据二

某航材备件消耗数据时间序列图

从上图中可以看出,数据有明显递增的趋势,为非平稳序列。

尝试进行一次差分对数据进行平稳化处理,结果表明仍未平稳,然后再做一次差分,再对进行2次差分后的数据进行,可以通过检验,故接受数据具有平稳性的原假设n可得出d等于2,并将数据进行零均值化,下面进一步确定ARMA(p.q)模型,

2•建立模型并进行参数估计

计算零均值化后序列的自相关函数(ACF)和偏自相关函数(PACF),结果如下图》其中,上下两条线为仕V®。

由图可以看出0

0.6

0.4

0.2

0

-0.2

-0.4

-0.6

-0.8

新序列的ACF(左)和PACF(右)

对P、q可能的组合进行参数估计,并利用AIC准则进行定阶,并对估计出的参数进行平稳性和可逆性检验,结果表明都在单位圆外,可以初步确定满足要求的最佳模型为ARMA(3.1)模型,即:

X;=-0.4420X;_1-O.Q6881X;_2一0.0892X;_3+et-0.685kt_i

(9)

式(9)中{&}为WN(0,o

3•白噪声检验

对已经通过平稳性和可逆性检验的模型(9)进行白噪声检验(4

声检验,模型合理:

:

4•预测及结果分析

根据模型(9),用一步预测的方法对后4组数据进行预测,并与移动平均法进行对比,如表20对预测结果进行多角度评价,具体选用的指标包括:

平均绝对误差:

I斤

MAE=^\yi-yil

ni=l(10)

平均相对误差:

MRE=丄丈

ni=iS(11)

预测均方差:

其中,y_i为备件消耗序列的实际数据,为模型预测数据。

预测结果对比

时间

真实值

移动平均法⑸

ARIMA欖型

预测值

MAE

MRE

MSE

预测值

MAE

MRE

MSE

12

%

%

9

8

7

注释:

[5]是

由上表预测结果及各项评价指标的对比可知,ARIMA模型预测结果明显优于移动平均法,从平均相对误差上来看,ARIMA模型为%,比移动平均法提高了将近15%,且预测的均方差也较小,仅》由此可见:

该模型能较准确地预测出备件消耗的变化趋势,可为备件消耗量的预测提供依据》

另由于ARIMA模型建立在历史数据的基础上,故搜集的历史数据越多,模型越准确。

该建模方法能综合反映装备使用的实际情况,具有很好的模型适应性。

模型具有较高的预测准确度,且有较成熟的软件支持(SPSS、Matlab等),易于推广,可进行备件消耗预测,确定备件需求

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 经济学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1