ImageVerifierCode 换一换
格式:DOCX , 页数:18 ,大小:574.52KB ,
资源ID:3100061      下载积分:2 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3100061.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第16章RapidMiner时间序列.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第16章RapidMiner时间序列.docx

1、第16章RapidMiner时间序列第 16章 时间序列16.1时序模式就餐饮企业而言,经常会碰到这样的问题:由于餐饮行业是生产和销售同时进行的, 因此销售预测对于餐饮企业十分必要。 如何基于菜品 历史销售数据,做好餐饮销售预测?以便减少菜品脱销现象和避免因备料不足而造成的生产延误, 从而减少菜品生产等待时间,提供给客户更优质的服务, 同时可以减少安全库存量,做到生产准时 制,降低物流成本。餐饮销售预测可以看作是基于时间序列的短期数据预测,预测对象为具体菜品销售量。常用按时间顺序排列的一组随机变量 X1,X2, ,Xt 来表示一个随机事件的时间序列, 简记为 Xt ;用 x1,x2, ,xn

2、或xt,t 1,2, ,n 表示该随机序列的 n 个有序观察值, 称之为序列长度为 n 的观察值序列。本章应用时间序列分析的目的就是给定一个已被观测了的时间序列,预测该序列的未来值。16.1.1时间序列算法常用的时间序列模型见表 16-1。表 16-1 常用时间序列模型模型名称描述平滑法平滑法常用于趋势分析和预测,利用修匀技术,削弱短 期随机波动对序列的影响,使序列平滑化。根据所用平滑技 术的不同,可具体分为移动平均法和指数平滑法。趋势拟合法趋势拟合法把时间作为自变量,相应的序列观察值作为 因变量,建立回归模型。根据序列的特征,可具体分为线性 拟合和曲线拟合。组合模型时间序列的变化主要受到长期

3、趋势( T )、季节变动 ( S )、周期变动( C )和不规则变动( )这四个因素的 影响。根据序列的特点,可以构建加法模型和乘法模型。加法模型: xt Tt St Ct t乘法模型: xt Tt St Ct tAR 模型xt 0 1xt 1 2xt 2 p xt p t以前 p 期的序列值 xt 1,xt 2, ,xt p 为自变量、随机变 量 Xt 的取值 xt 为因变量建立线性回归模型。MA 模型xt t 1 t 1 2 t 2 q t q随机变量 Xt 的取值 xt 与以前各期的序列值无关,建立 xt 与前 q期的随机扰动 t 1, t 2, , t q 的线性回归模型。ARMA 模

4、型xt 0 1xt 1 2xt 2 p xt p t1 t 1 2 t 2 q t q随机变量 Xt 的取值 xt 不仅与以前 p 期的序列值有关, 还与前 q 期的随机扰动有关。ARIMA 模型许多非平稳序列差分后会显示出平稳序列的性质,称这 个非平稳序列为差分平稳序列。对差分平稳序列可以使用 ARIMA 模型进行拟合。ARCH 模型ARCH 模型能准确地模拟时间序列变量的波动性的变 化,适用于序列具有异方差性并且异方差函数短期自相关。GARCH 模型及其衍生模型GARCH 模型称为广义 ARCH 模型,是 ARCH 模型的拓 展。相比于 ARCH 模型, GARCH 模型及其衍生模型更能反

5、 映实际序列中的长期记忆性、信息的非对称性等性质。本章将重点介绍 AR 模型、 MA 模型、 ARMA 模型和 ARIMA 模型。16.1.2时间序列的预处理拿到一个观察值序列后, 首先要对它的纯随机性和平稳性进行检验, 这两个重要的检验称为序 列的预处理。 根据检验结果可以将序列分为不同的类型, 对不同类型的序列会采取不同的分析方法。对于纯随机序列,又叫白噪声序列, 序列的各项之间没有任何相关关系,序列在进行完全无序 的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列;对于平稳非白噪声序列, 它的均值和方差是常数, 现已有一套非常成熟的平稳序列的建模方法。 通常是建立一

6、个线性模型来拟合该序列的发展,借此提取该序列的有用信息。 ARMA 模型是最常 用的平稳序列拟合模型;对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列, 这样就 可以应用有关平稳时间序列的分析方法,如建立 ARMA 模型来进行相应的研究。如果一个时间序 列经差分运算后具有平稳性,成该序列为差分平稳序列,可以使用 ARIMA 模型进行分析。1.平稳性检验( 1) 平稳时间序列的定义对于随机变量 X ,可以计算其均值(数学期望) 、方差 2 ;对于两个随机变量量 X 和Y , 可以计算 X,Y 的协方差 cov(X , Y) E(X X )(Y Y) 和相关系数 (X,Y

7、) cov( X , Y) ,它 XY 们度量了两个不同事件之间的相互影响程度。对于时间序列 Xt,t T ,任意时刻的序列值 Xt 都是一个随机变量,每一个随机变量都会有 均值和方差,记 Xt 的均值为 t ,方差为 t ;任取 t,s T ,定义序列 Xt的自协方差函数(t,s) E(Xt t )(Xs s )和自相关系数 (t,s) cov( Xt,Xs) (特别地,ts(t,t) (0) 1, 0 1),之所以称它们为自协方差函数和自相关系数, 是因为它们衡量的是同一个事件在两个不同时期(时刻 t 和 s)之间的相关程度,形象地讲就是度量自己过去的行为对自己 现在的影响。如果时间序列

8、Xt,t T 在某一常数附近波动且波动范围有限,即有常数均值和常数方差, 并且延迟 k 期的序列变量的自协方差和自相关系数是相等的或者说延迟 k 期的序列变量之间的影响 程度是一样的,则称 Xt,t T 为平稳序列。( 2) 平稳性的检验对序列的平稳性的检验有两种检验方法, 一种是根据时序图和自相关图的特征做出判断的图检 验,该方法操作简单、应用广泛,缺点是带有主观性;另一种是构造检验统计量进行的方法,目前 最常用的方法是单位根检验。时序图检验根据平稳时间序列的均值和方差都为常数的性质, 平稳序列的时序图显示该序列值始终在一个 常数附近随机波动, 而且波动的范围有界; 如果有明显的趋势性或者周

9、期性那它通常不是平稳序列。自相关图检验平稳序列具有短期相关性, 这个性质表明对平稳序列而言通常只有近期的序列值对现时值得影 响比较明显,间隔越远的过去值对现时值得影响越小。随着延迟期数 k 的增加,平稳序列的自相关系数 k (延迟 k期)会比较快的衰减趋向于零,并在零附近随机波动,而非平稳序列的自相关系数衰减的速度比较慢,这就是利用自相关图进行平稳性检验的标准。单位根检验 单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。2.纯随机性检验如果一个序列式纯随机序列,那么它的序列值之间应该没有任何关系,即满足(k) 0,k 0 ,这是一种理论上才会出现的理想状态,实际上纯

10、随机序列的样本自相关系数 不会绝对为零,但是很接近零,并在零附近随机波动。纯随机性检验也称白噪声检验, 一般是构造检验统计量来检验序列的纯随机性, 常用的检验统 计量有 Q 统计量、 LB 统计量,由样本各延迟期数的自相关系数可以计算得到检验统计量,然后计 算出对应的 p 值,如果 p 值显著大于显著性水平 ,则表示该序列不能拒绝纯随机的原假设,可 以停止对该序列的分析。16.1.3平稳时间序列分析ARMA 模型的全称是自回归移动平均模型,它是目前最常用的拟合平稳序列的模型。它又可以细分为 AR 模型、 MA 模型和 ARMA 三大类。都可以看作是多元线性回归模型。1. AR 模型具有如下结构

11、的模型称为 p 阶自回归模型,简记为 AR(p):xt 0 1xt 1 2xt 2 pxt p t (16-1)即在 t 时刻的随机变量 Xt 的取值 xt是前 p 期 xt 1,xt 2, ,xt p 的多元线性回归,认为 xt 主要 是受过去 p 期的序列值的影响。误差项是当期的随机干扰 t ,为零均值白噪声序列。平稳 AR 模型的性质见表 16-2:表 16-2 平稳 AR 模型的性质统计量性质均值常数均值方差常数方差自相关系数( ACF )拖尾偏自相关系数 (PACF)p 阶截尾361均值对满足平稳性条件的 AR(p) 模型的方程,两边取期望,得:E(xt ) E( 0 1xt 1 2

12、xt 2 pxt p t) (16-2)已知 E(xt ) ,E( t) 0,所以有 0 1 2 p ,平稳 AR(p) 模型的方差有界,等于常数。 自相关系数( ACF )平稳 AR(p) 模型的自相关系数k (t,t k) cov(Xt,Xt k) 呈指数的速度衰减, 始终有非 t t k零取值,不会在 k 大于某个常数之后就恒等于零, 这个性质就是平稳 AR( p)模型的自相关系数 k 具有拖尾性。偏自相关系数( PACF)对于一个平稳 AR(p)模型,求出延迟 k期自相关系数 k 时,实际上的得到的并不是 Xt 与 Xt k 之间单纯的相关关系,因为 Xt 同时还会受到中间 k 1个随

13、机变量 Xt 1,Xt 2, ,Xt k 1的影响, 所 以自相关系数 k 里实际上掺杂了其他变量对 Xt 与 Xt k的相关影响, 为了单纯地测度 Xt k对 Xt的 影响,引进偏自相关系数的概念。可以证明平稳 AR(p)模型的偏自相关系数具有 p 阶截尾性。这个性质连同前面的自相关系数 的拖尾性是 AR( p)模型重要的识别依据。2. MA 模型具有如下结构的模型称为 q阶自回归模型,简记为 MA(q) :xt t 1 t 1 2 t 2 q t q (16-4)即在 t时刻的随机变量 Xt 的取值 xt是前 q期的随机扰动 t 1, t 2, , t q的多元线性函数,误 差项是当期的随

14、机干扰 t ,为零均值白噪声序列, 是序列 Xt 的均值。认为 xt主要是受过去 q 期的误差项的影响。平稳 MA(q) 模型的性质见表 16-3:表 16-3 平稳 MA 模型的性质统计量性质均值常数均值方差常数方差自相关系数( ACF )q 阶截尾偏自相关系数( PACF)拖尾3.ARMA 模型具有如下结构的模型称为自回归移动平均模型,简记为 ARMA( p, q) :xt 0 1xt 1 2xt 2 pxt p t 1 t 1 2 t 2 q t q (16-5)即在 t时刻的随机变量 Xt 的取值 xt是前 p 期 xt 1,xt 2, ,xt p 和前 q期 t 1, t 2, ,

15、t q 的多元线性函数,误差项是当期的随机干扰 t ,为零均值白噪声序列。认为 xt 主要是受过去 p 期的序 列值和过去 q 期的误差项的共同影响。特别的,当 q 0时,是 AR(p) 模型;当 p 0时,是 MA(q) 模型。平稳 ARMA ( p, q)的性质见表 16-4:表 16-4 平稳 ARMA 模型的性质统计量性质均值常数均值方差常数方差自相关系数( ACF )拖尾偏自相关系数 (PACF)拖尾4.平稳时间序列建模某个时间序列经过预处理,被判定为平稳非白噪声序列,就可以利用 ARMA 模型进行建模。 计算出平稳非白噪声序列 Xt 的自相关系数和偏自相关系数,再由 AR(p) 模型、 MA(q)和ARMA(p,q)的自相关系数和偏自相关系数的性质, 选择合适的模型。 平稳时间序列建模步骤见图 1。图 1-1 平稳时间序列 ARMA 模型建模步骤1) 计算 ACF 和 PACFPACF)先计算非平稳白噪声序列的自相关系数( ACF )和偏自相关系数(2) ARMA 模型识别也叫模型定阶, 由 AR(p)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1