第16章RapidMiner时间序列.docx

上传人:b****5 文档编号:3100061 上传时间:2022-11-17 格式:DOCX 页数:18 大小:574.52KB
下载 相关 举报
第16章RapidMiner时间序列.docx_第1页
第1页 / 共18页
第16章RapidMiner时间序列.docx_第2页
第2页 / 共18页
第16章RapidMiner时间序列.docx_第3页
第3页 / 共18页
第16章RapidMiner时间序列.docx_第4页
第4页 / 共18页
第16章RapidMiner时间序列.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

第16章RapidMiner时间序列.docx

《第16章RapidMiner时间序列.docx》由会员分享,可在线阅读,更多相关《第16章RapidMiner时间序列.docx(18页珍藏版)》请在冰豆网上搜索。

第16章RapidMiner时间序列.docx

第16章RapidMiner时间序列

第16章时间序列

16.1时序模式

就餐饮企业而言,经常会碰到这样的问题:

由于餐饮行业是生产和销售同时进行的,因此销售预测对于餐饮企业十分必要。

如何基于菜品历史销售数据,做好餐饮销售预测?

以便减少菜品脱销现象和避免因备料不足而造成的生产延误,从而减少菜品生产等待时间,提供给客户更优质的服务,同时可以减少安全库存量,做到生产准时制,降低物流成本。

餐饮销售预测可以看作是基于时间序列的短期数据预测,预测对象为具体菜品销售量。

常用按时间顺序排列的一组随机变量X1,X2,,Xt来表示一个随机事件的时间序列,简记为{Xt};用x1,x2,,xn或{xt,t1,2,,n}表示该随机序列的n个有序观察值,称之为序列长度为n的观察值序列。

本章应用时间序列分析的目的就是给定一个已被观测了的时间序列,预测该序列的未来值。

16.1.1时间序列算法

常用的时间序列模型见表16-1。

表16-1常用时间序列模型

模型名称

描述

平滑法

平滑法常用于趋势分析和预测,利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化。

根据所用平滑技术的不同,可具体分为移动平均法和指数平滑法。

趋势拟合法

趋势拟合法把时间作为自变量,相应的序列观察值作为因变量,建立回归模型。

根据序列的特征,可具体分为线性拟合和曲线拟合。

组合模型

时间序列的变化主要受到长期趋势(T)、季节变动(S)、周期变动(C)和不规则变动()这四个因素的影响。

根据序列的特点,可以构建加法模型和乘法模型。

加法模型:

xtTtStCtt

 

乘法模型:

xtTtStCtt

AR模型

xt01xt12xt2pxtpt

以前p期的序列值xt1,xt2,,xtp为自变量、随机变量Xt的取值xt为因变量建立线性回归模型。

MA模型

xtt1t12t2qtq

随机变量Xt的取值xt与以前各期的序列值无关,建立xt与前q期的随机扰动t1,t2,,tq的线性回归模型。

ARMA模型

xt01xt12xt2pxtpt

1t12t2qtq

随机变量Xt的取值xt不仅与以前p期的序列值有关,还与前q期的随机扰动有关。

ARIMA模型

许多非平稳序列差分后会显示出平稳序列的性质,称这个非平稳序列为差分平稳序列。

对差分平稳序列可以使用ARIMA模型进行拟合。

ARCH模型

ARCH模型能准确地模拟时间序列变量的波动性的变化,适用于序列具有异方差性并且异方差函数短期自相关。

GARCH模型

及其衍生模型

GARCH模型称为广义ARCH模型,是ARCH模型的拓展。

相比于ARCH模型,GARCH模型及其衍生模型更能反映实际序列中的长期记忆性、信息的非对称性等性质。

本章将重点介绍AR模型、MA模型、ARMA模型和ARIMA模型。

16.1.2时间序列的预处理

拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。

根据检验结果可以将序列分为不同的类型,对不同类型的序列会采取不同的分析方法。

对于纯随机序列,又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。

白噪声序列是没有信息可提取的平稳序列;

对于平稳非白噪声序列,它的均值和方差是常数,现已有一套非常成熟的平稳序列的建模方法。

通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。

ARMA模型是最常用的平稳序列拟合模型;

对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列,这样就可以应用有关平稳时间序列的分析方法,如建立ARMA模型来进行相应的研究。

如果一个时间序列经差分运算后具有平稳性,成该序列为差分平稳序列,可以使用ARIMA模型进行分析。

1.平稳性检验

(1)平稳时间序列的定义

对于随机变量X,可以计算其均值(数学期望)、方差2;对于两个随机变量量X和Y,可以计算X,Y的协方差cov(X,Y)E[(XX)(YY)]和相关系数(X,Y)cov(X,Y),它XY们度量了两个不同事件之间的相互影响程度。

对于时间序列{Xt,tT},任意时刻的序列值Xt都是一个随机变量,每一个随机变量都会有均值和方差,记Xt的均值为t,方差为t;任取t,sT,定义序列{Xt}的自协方差函数

(t,s)E[(Xtt)(Xss)]和自相关系数(t,s)cov(Xt,Xs)(特别地,

ts

(t,t)(0)1,01),之所以称它们为自协方差函数和自相关系数,是因为它们衡量的是同一

个事件在两个不同时期(时刻t和s)之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。

如果时间序列{Xt,tT}在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并

且延迟k期的序列变量的自协方差和自相关系数是相等的或者说延迟k期的序列变量之间的影响程度是一样的,则称{Xt,tT}为平稳序列。

(2)平稳性的检验

对序列的平稳性的检验有两种检验方法,一种是根据时序图和自相关图的特征做出判断的图检验,该方法操作简单、应用广泛,缺点是带有主观性;另一种是构造检验统计量进行的方法,目前最常用的方法是单位根检验。

时序图检验

根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动的范围有界;如果有明显的趋势性或者周期性那它通常不是平稳序列。

自相关图检验

平稳序列具有短期相关性,这个性质表明对平稳序列而言通常只有近期的序列值对现时值得影响比较明显,间隔越远的过去值对现时值得影响越小。

随着延迟期数k的增加,平稳序列的自相关

系数k(延迟k期)会比较快的衰减趋向于零,并在零附近随机波动,而非平稳序列的自相关系

数衰减的速度比较慢,这就是利用自相关图进行平稳性检验的标准。

单位根检验单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。

2.纯随机性检验

如果一个序列式纯随机序列,那么它的序列值之间应该没有任何关系,即满足

(k)0,k0,这是一种理论上才会出现的理想状态,实际上纯随机序列的样本自相关系数不会绝对为零,但是很接近零,并在零附近随机波动。

纯随机性检验也称白噪声检验,一般是构造检验统计量来检验序列的纯随机性,常用的检验统计量有Q统计量、LB统计量,由样本各延迟期数的自相关系数可以计算得到检验统计量,然后计算出对应的p值,如果p值显著大于显著性水平,则表示该序列不能拒绝纯随机的原假设,可以停止对该序列的分析。

16.1.3平稳时间序列分析

ARMA模型的全称是自回归移动平均模型,它是目前最常用的拟合平稳序列的模型。

它又可

以细分为AR模型、MA模型和ARMA三大类。

都可以看作是多元线性回归模型。

1.AR模型

具有如下结构的模型称为p阶自回归模型,简记为AR(p):

xt01xt12xt2pxtpt(16-1)

即在t时刻的随机变量Xt的取值xt是前p期xt1,xt2,,xtp的多元线性回归,认为xt主要是受过去p期的序列值的影响。

误差项是当期的随机干扰t,为零均值白噪声序列。

平稳AR模型的性质见表16-2:

表16-2平稳AR模型的性质

统计量

性质

均值

常数均值

方差

常数方差

自相关系数(ACF)

拖尾

偏自相关系数(PACF)

p阶截尾

361

均值

对满足平稳性条件的AR(p)模型的方程,两边取期望,得:

E(xt)E(01xt12xt2pxtpt)(16-2)

已知E(xt),E(t)0,所以有012p,

平稳AR(p)模型的方差有界,等于常数。

自相关系数(ACF)

平稳AR(p)模型的自相关系数

k(t,tk)cov(Xt,Xtk)呈指数的速度衰减,始终有非ttk

零取值,不会在k大于某个常数之后就恒等于零,这个性质就是平稳AR(p)模型的自相关系数k具有拖尾性。

偏自相关系数(PACF)

对于一个平稳AR(p)模型,求出延迟k期自相关系数k时,实际上的得到的并不是Xt与Xtk之间单纯的相关关系,因为Xt同时还会受到中间k1个随机变量Xt1,Xt2,,Xtk1的影响,所以自相关系数k里实际上掺杂了其他变量对Xt与Xtk的相关影响,为了单纯地测度Xtk对Xt的影响,引进偏自相关系数的概念。

可以证明平稳AR(p)模型的偏自相关系数具有p阶截尾性。

这个性质连同前面的自相关系数的拖尾性是AR(p)模型重要的识别依据。

2.MA模型

具有如下结构的模型称为q阶自回归模型,简记为MA(q):

xtt1t12t2qtq(16-4)

即在t时刻的随机变量Xt的取值xt是前q期的随机扰动t1,t2,,tq的多元线性函数,误差项是当期的随机干扰t,为零均值白噪声序列,是序列{Xt}的均值。

认为xt主要是受过去q期的误差项的影响。

平稳MA(q)模型的性质见表16-3:

表16-3平稳MA模型的性质

统计量

性质

均值

常数均值

方差

常数方差

自相关系数(ACF)

q阶截尾

偏自相关系数(PACF)

拖尾

3.ARMA模型

具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q):

xt01xt12xt2pxtpt1t12t2qtq(16-5)

即在t时刻的随机变量Xt的取值xt是前p期xt1,xt2,,xtp和前q期t1,t2,,tq的多

元线性函数,误差项是当期的随机干扰t,为零均值白噪声序列。

认为xt主要是受过去p期的序列值和过去q期的误差项的共同影响。

特别的,当q0时,是AR(p)模型;当p0时,是MA(q)模型。

平稳ARMA(p,q)的性质见表16-4:

表16-4平稳ARMA模型的性质

统计量

性质

均值

常数均值

方差

常数方差

自相关系数(ACF)

拖尾

偏自相关系数(PACF)

拖尾

4.平稳时间序列建模

某个时间序列经过预处理,被判定为平稳非白噪声序列,就可以利用ARMA模型进行建模。

计算出平稳非白噪声序列{Xt}的自相关系数和偏自相关系数,再由AR(p)模型、MA(q)和

ARMA(p,q)的自相关系数和偏自相关系数的性质,选择合适的模型。

平稳时间序列建模步骤见图1。

图1-1平稳时间序列ARMA模型建模步骤

1)计算ACF和PACF

PACF)

先计算非平稳白噪声序列的自相关系数(ACF)和偏自相关系数(

2)ARMA模型识别

也叫模型定阶,由AR(p)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1