第一章时间序列分析概论资料.docx

上传人:b****8 文档编号:9585100 上传时间:2023-02-05 格式:DOCX 页数:26 大小:364.26KB
下载 相关 举报
第一章时间序列分析概论资料.docx_第1页
第1页 / 共26页
第一章时间序列分析概论资料.docx_第2页
第2页 / 共26页
第一章时间序列分析概论资料.docx_第3页
第3页 / 共26页
第一章时间序列分析概论资料.docx_第4页
第4页 / 共26页
第一章时间序列分析概论资料.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

第一章时间序列分析概论资料.docx

《第一章时间序列分析概论资料.docx》由会员分享,可在线阅读,更多相关《第一章时间序列分析概论资料.docx(26页珍藏版)》请在冰豆网上搜索。

第一章时间序列分析概论资料.docx

第一章时间序列分析概论资料

第一章时间序列分析概论

人类为了探索周围的世界,常常按照时间顺序进行观测。

这种观测数据有着比较独特的特点,即将来的数据通常以某种随机的方式依赖于当前得到的观测数据,而观测数据的这种相依性使得利用过去预测未来成为可能。

时间序列是变量按时间间隔的顺序而形成的随机变量序列。

大量自然界、社会经济等领域的统计指标都依年、季、月或日统计其指标值,随着时间的推移,形成了统计指标的时间序列。

因此,时间序列是某一统计指标长期变动的数量表现。

时间序列分析就是估算和研究某一时间序列在长期变动过程中所存在的统计规律性。

本章将介绍时间序列分析的基本思想和一般概论。

§1.1时间序列的定义和例子

在统计研究中,有大量的数据是按照时间顺序排列的,使用数学方法表述即用一组随机序列

(1.1)

表示随机事件的时间序列,简记为

或者

类似于样本与样本观测值的关系,我们可以使用

(1.2)

表示上述时间序列(1.1)的n个有序观测值,称其为序列长度为n的观测值序列。

在时间序列问题中,数据的时间顺序是重要的,时间序列的一个显著的特征就是记录的相依性。

一般来说,关于时间序列

,对于任意的t,

是一个随机变量,且每个随机变量所服从的分布可以不同,对于任意的t,s,

不是相互独立的。

时间序列的应用背景十分广泛,依照不同的需要,数据的收集可以按小时、天、周、月或者年等间隔进行,现在更有按照秒为时间间隔的所谓高频时间序列。

下面我们介绍一些不同领域中的实际数据例子。

例1.1820年—1869年的太阳黑子数据(单位:

个):

太阳黑子是太阳表面上的黑点,它反映了太阳振动的全部演变,与太阳发电效应的行为有关。

1820年—1869年的太阳黑子数依时间划在图1.1中,横轴是时间指标,纵轴表示在时间t的观测值

,这种图称为时间序列图。

图1.11820年—1869年间太阳黑子数据(单位:

个)

例2.1985年—2007年我国居民消费价格指数(CPI):

所谓CPI即为消费者物价指数(Consumer Price Index),英文缩写CPI,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。

如果消费者物价指数升幅过大,表明通胀已经成为经济不稳定因素。

本例给出了我国1985年—2007年的年度数据,具体参见图1.2和附录。

图1.21985年—2007年我国居民消费价格指数(CPI)

例3.1978年—2007年我国GDP数据(单位:

亿元):

GDP也就是国内生产总值。

它是对一国(地区)经济在核算期内所有常住单位生产的最终产品总量的度量,常常被看成显示一个国家(地区)经济状况的一个重要指标。

本例给出我国1978年—2007年GDP数据(单位:

亿元),具体参见图1.3和附录。

图1.31978年—2007年我国GDP(单位:

亿元)

例4.北京在历史上也是自然灾害频发的地区,在各种自然灾害中,水旱灾害发生的次数最多,危害最大。

表1.1列出了北京地区1949年—1964年的洪涝灾害面积数据(单位:

万亩)

表1.1北京地区1949年—1964年的洪涝灾害面积

年份

受灾面积

年份

受灾面积

1949

331.12

1957

25.00

1950

380.44

1958

84.72

1951

59.63

1959

260.89

1952

37.89

1960

27.18

1953

103.66

1961

20.74

1954

316.67

1962

52.99

1955

208.72

1963

99.25

1956

288.78

1964

55.36

我们使用

表示第一年(1949年)的受灾面积,

表示第二年(1950年)的受灾面积等等,

是一列按照时间顺序排列的随机序列,所以是时间序列。

是北京地区1949年—1964年的洪涝受灾面积,则

是时间序列

的样本观测值,样本容量为16,它是时间序列

的一次实现的一部分。

时间序列

的样本观测值

可以由图1.4表示

图1.4北京地区1949年—1964年的洪涝灾害面积

例5.1992年第一季度至2008年第三季度我国GDP季度数据(单位:

亿元):

图1.5是我国1992年第一季度至2008年第三季度GDP季度数据(单位:

亿元),数据见附录。

图1.51992年第一季度至2008年第三季度我国GDP(单位:

亿元)

例6.1997年1月—2008年9月美元对人民币汇率的月度数据(单位:

元):

2005年7月21日中国启动人民币汇率改革以来,不断完善汇率形成机制,人民币对美元汇率总体呈现小幅上扬态势。

过去两年多,人民币累计升值近16%。

2008年以来,人民币汇率升幅已接近4.5%。

图1.61997年1月—2008年9月美元对人民币汇率(单位:

元)

例7.1990年12月19日—2008年11月6日上证指数日数据:

上证综合指数的样本股是全部上市股票,包括A股和B股,从总体上反映了上海证券交易所上市股票价格的变动情况,自1991年7月15日起正式发布。

图1.71990年12月19日—2008年11月6日上证指数

例8.1980年1月—1991年10月澳大利亚红酒的月度销量(单位:

公升):

时间集

{1980.01,1980.02,……,1991.10},包括共142个时间点。

图1.81980年1月—1991年10月澳大利亚红酒的月度销量(单位:

公升)

从图1.8中我们可以看到,澳大利亚红酒月度销量存在一个较为明显上升趋势,同时又有季节模式,在每年的1月有一个销售淡季而在每年的7月都有一个销售高峰。

例9.美国每年罢工总数(1951—1980):

1951年—1980年,美国每年发生的罢工次数数据见图1.9,该图显示了这些数据一种不规律的上下波动。

在这里我们从中看不出什么很明显的趋势,至于这一序列是否平稳,还有待于用后面的知识进行进一步的验证。

图1.91951年—1980年美国每年罢工总数

例10.1994年1月1日—1995年12月31日香港环境数据序列:

(a)表示因循环和呼吸问题前往医院就诊的人数;(b)表示二氧化硫的日平均水平;(c)表示二氧化氮的日平均水平;(d)表示可吸入的悬浮颗粒物的日平均水平。

上述例子涉及到天文学、经济学、金融学、社会学和环境科学等领域,其实有关时间序列数据不仅仅只存在这些领域中,还存在于更多的其他领域之中,更多的实际例子我们将在后面的内容里陆续引入。

时间序列分析突出发展从数据获得推断的有效方法,其的目的就是建立一个能很好描述数据的随机模型,使得观测到的时间序列可以看作是该随机模型的一个实现。

这个模型应该能够反映内在的动态行为,并且只要模型是合适的,就能够用来预报和控制。

§1.2时间序列分析方法简介

时间序列分析的目的是不同的,它依赖于应用背景。

一般地,时间序列被看作是一个随机过程的实现。

分析的基本任务是揭示支配观测到的时间序列的随机规律,通过所了解的这个随机规律,我们可以理解所要考虑的动态系统,预报未来的事件,并且通过干预来控制将来事件。

上述即为时间序列分析的三个目的。

BoxandJenkins(1970)的专著“TimeSeriesAnalysis:

ForecastingandControl”是时间序列分析发展的里程碑,他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARIMA模型识别、估计和诊断的系统方法。

使ARIMA模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础,这种对ARIMA模型识别、估计和诊断的系统方法简称B-J方法。

对于通常的ARIMA的建模过程,B-J方法的具体步骤如下:

第一步、关于时间序列进行特性分析。

一般地,从时间序列的随机性、平稳性和季节性三方面进行考虑。

其中平稳性和季节性更为重要,对于一个非平稳时间序列,若要建模首先要将其平稳化,其方法通常有三种:

(1)差分,一些序列通过差分可以使其平稳化。

(2)季节差分,如果序列具有周期波动特点,为了消除周期波动的影响,通常引入季节差分。

(3)函数变换与差分的结合运用,某些序列如果具有某类函数趋势,我们可以先引入某种函数变换将序列转化为线性趋势,然后再进行差分以消除线性趋势。

第二步、模型的识别与建立,这是ARMA模型的建模重要一步。

首先需要计算时间序列的样本的自相关函数和偏自相关函数,利用自相关函数分析图进行模型识别和定阶。

一般来说,使用一种方法往往无法完成模型识别和定阶,并且需要估计几个不同的确认模型。

在确定了模型阶数后,就要对模型的参数进行估计。

得到模型之后,应该对模型的适应性进行检验。

第三步、模型的预测与模型的评价。

B-J方法通常采用了线性最小方差预测法。

一般地,评价和分析模型的方法是对时间序列进行历史模拟。

此外,还可以做事后预测,通过比较预测值和实际值来评价预测的精确程度。

时间序列分析早期的研究分为时域分析方法和频域分析方法。

所谓频域分析方法,也称为“频谱分析”或者“谱分析”方法,是着重研究时间序列的功率谱密度函数,对序列的频率分量进行统计分析和建模。

对于平稳序列来说,自相关函数是功率谱密度函数的Fourier变换。

但是由于谱分析过程一般都比较复杂,其分析结果也比较抽象,不易于进行直观解释,所以一般来说谱分析方法的使用具有较大的局限性。

时域分析方法是分析时间序列的样本自相关函数,并建立参数模型(例如ARIMA模型),以此去描述序列的动态依赖关系。

时域分析方法的基本思想是源于事件的发展通常都具有一定的惯性,这种惯性使用统计语言来描述即为序列之间的相关关系,而这种相关关系具有一定的统计性质,时域分析的重点就是寻找这种统计规律,并且拟合适当的数学模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。

时域分析方法最早可以追溯到1927年,英国统计学家G.U.Yule提出了自回归(Autoregressive)模型。

后来,英国数学家、天文学家G.T.Walker(1931)在分析印度大气规律时引入了移动平均(MovingAverage)模型和自回归移动平均(AutoregressiveMovingAverage)模型。

这些模型奠定了时间序列分析时域分析方法的基础。

相对于频域分析方法,时域分析方法具有比较系统的统计理论基础,操作过程规范,分析结果易于解释。

随着研究的深入和计算技术的发展,时域方法和频域方法之间的鸿沟已趋消失。

但是,相对于频域分析方法,时域分析方法具有比较系统的统计理论基础,操作过程规范,分析结果易于解释。

鉴于此,本书主要应用时域方法进行时间序列分析。

计算技术的飞速进步极大地推动了时间序列分析的发展。

线性正态假定下的参数模型得到充分地解决,计算量较大的离群值分析和结构变化的识别成为时间序列模型诊断的重要部分。

非线性时间序列分析也得到充分的发展,实际上,我们常常会遇到理论上和数据分析上都不属于线性的。

在这种情况下,我们需要引入非线性时间序列。

Tong(汤家豪,1980)利用分段线性化构造模型的思想提出了门限自回归模型开创了非线性时间序列分析的先河。

门限自回归模型的特征恰好刻画了自然界的突变现象,例如在经济领域,许多指标受到多种因素的影响,使某些观测序列呈跳跃变化,在水文、气象等领域中也有诸多类似的现象。

TongandLim(1980)认为这类模型是一个非常实用的模型,可以解决很多线性模型不能解决的问题。

在时间序列分析方法的发展历程中,商业、经济、金融等领域的应用始终起着重要的推动作用,时间序列分析的每一步发展都与应用密不可分。

随着计算机的快速发展,时间序列分析在商业、经济、金融等各个领域的应用越来越广泛,经济分析涉及到大量的时间序列数据,如股票市场中的综合指数、个股每日的收盘价等。

从经济学的角度来说,个人为了获得最大利益,总是力图对经济变量作出最准确的预期,以避免行动的盲目性。

在股票市场上,每个人都想正确地预期到股票将来的价格。

由于股票市场属于“不对称信息”(AsymmetricInformation)市场,投资者往往无法准确地获取各种充分的信息,只能凭借历史的和不完整的信息来推测,因此,如何准确地分析、预测股票价格变动的方向和程度大小成为股市投资的基础和重点。

在金融时间序列分析中,主要用于以下几个方面的研究:

(1).研究金融过程的动态结构;

(2).探索金融变量之间的动态关系;

(3).对金融数据进行季节或其它形式的周期调整(如日内效应、周效应等);

(4).通过对具有自相关关系的模型误差分析,改进用时间序列进行回归分析的模型;

(5).对均值或波动率进行点预测或区间预测。

金融时间序列建模不仅需要研究时间序列数据,而且要研究时间间隔序列,这些研究使得时间序列分析不仅需要统计方法,同时需要融入更多的随机过程成份。

在现代金融理论中,金融市场上收益的风险和价格的不确定性往往是用方差来度量的。

金融市场一般包括货币资金融通市场、有价证券市场、资本和外汇市场等等,其主要数据来源于资金融通市场,如债券市场的利率,股票市场的价格(它反映了收益率)外汇市场的汇率等等。

传统的计量经济学模型往往假定样本的方差保持不变,随着金融理论的发展和实证分析工作的深入,越来越发现这一假设的不尽合理性。

大量的来自于金融市场的数据分析已表明,用于表示不确定性的风险的方差是随着时间变化的。

金融市场证券价格波动具有随时间变化的特征,有时相对稳定,有时波动异常激烈。

金融市场上证券数据从一个时期到另一个时期的变化过程中,常常出现价格波动聚集(VolatityClustering)现象,大幅度波动聚集在某一段时间,而小幅度波动聚集在另一些时段上。

一般地,描述风险资产(如股票,期权)的价格,需引入随机变量,而且其方差往往也随时间变化的。

Engle(1982)在研究英国的通货膨胀时首次提出了ARCH(AutoregressiveConditionalHeteroskedasticity)模型,他利用ARCH模型来刻画数据中存在的条件异方差。

他认为条件异方差是外生变量,滞后的内生变量,时间,参数和前期残差的函数。

从而使得模型能够较为贴切地刻画了金融市场的变化状况,描述金融市场的变化特征。

Engle和其合作者还对ARCH模型进行了很多扩展,比如IGARCH模型(BollerslevandEngle,1986)、FARCH模型(Engle,1987),对市场微观结构研究的ACD模型(EngleandRussell,1998;Engle,2000)。

另外,很多学者提出了其它类型的ARCH模型,比如Nelson(1991)的指数ARCH模型。

目前ARCH模型的研究仍然是计量经济学研究的热门领域,而ARCH在金融学中的应用研究出现了一门的新的学科―金融计量经济学,而这一学科也处在不断的发展之中。

金融高频时间序列分析从二十世纪90年代开始迅速发展,目前已经涉及的内容十分广泛,对于金融高频数据的计量建模就是其中的一个重要研究方向。

高频金融时间序列通常是指以天、小时、分钟甚至秒为频率所采集的按时间先后顺序排列的金融类数据以及记录每笔交易的时间序列。

从金融高频数据产生至今,对金融高频时间序列分析一直是金融研究领域中一个倍受瞩目的焦点。

这可以归结为两个原因:

一个是由于对金融高频数据本身所具有的特征值的关注。

通常所指的交易数据,除了交易价格外,还包括与交易相连的询价和报价、交易数量、交易之间的时间间隔、相似资产的现价等等。

因此,对于金融高频数据的分析,实质上是一个关于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的”复杂多变量问题。

这样如何从总体上来分析金融高频数据、又如何处理具体金融交易中高频数据的特殊性,便成为众多金融领域的从业者和研究者所面临的一个有趣而又富有挑战性的课题。

由于金融高频数据具有许多新的特征,如波动率日内“U”型走势、波动率具有日历性、价格序列具有极高的峰值、价格序列一阶负相关、宽尾、非正态、波动率聚集、随机不等间隔以及价格离散取值等,这些特征使得传统的模型假设失去了意义,需要探寻新的计量模型来刻画这些数据特征。

近年来计量模型研究的核心内容是交易间隔(intratradeduration)与交易特征值,如收益、讯报价差额、交易量等之间的Granger因果关系。

它们认为较长的时间间隔意味着缺少交易活动,也代表着一个没有新信息产生的时期,因此,时间间隔行为的动态性中含有关于日内市场活动的有用信息。

金融高频时间序列分析对金融市场的计量建模、实证金融、乃至连续金融产生了巨大的挑战和冲击,从而也加速了各个研究领域的融合。

§1.3时间序列分析软件

计算机技术的进步极大地促进了时间序列分析的发展。

目前,许多统计软件都可以用于时间序列分析工作。

常用软件S-plus、Matlab、Gauss、TSP、Eviews和SAS软件。

SAS(StatisticalAnalysisSystem)软件是由美国北卡来罗纳州立大学(NorthCarolinaStateUniversity)的两位教授(A.J.BarrandJ.H.Goodnight)共同开发的,这是一个专门用于数学建模和统计分析的软件系统,经过多年的发展,SAS已被全世界120多个国家和地区的近三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。

在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在1996—1997年度被评选为建立数据库的首选产品。

SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。

BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。

也就是说,SAS系统的运行,首先必须启动BASESAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。

它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。

各模块的安装及更新都可通过其安装程序非常方便地进行。

SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASESAS的基础上,还可以增加如下不同的模块而增加不同的功能:

SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。

SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。

SAS提供多个统计过程,每个过程均含有极丰富的任选项。

用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。

此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。

SAS/ETS(经济计量学和时间序列分析模块)编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件。

由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势。

由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此其操作至今仍以编程为主,人机对话界面不太友好,并且在编程操作时需要用户最好对所使用的统计方法有较清楚的了解,非统计专业人员掌握起来较为困难。

EViews是美国GMS公司1981年发行第1版的Micro TSP的Windows版本,通常称为计量经济学软件包。

EViews是Econometrics Views的缩写,它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。

计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、运用模型进行预测、求解模型和运用模型,EViews是完成上述任务得力的必不可少的工具。

是当今世界上最流行的计量经济学软件之一。

正是由于EViews等计量经济学软件包的出现,使计量经济学取得了长足的进步,发展成为实用与严谨的经济学科。

使用 EViews软件包可以对时间序列和非时间序列的数据进行分析,建立序列(变量)间的统计关系式,并用该关系式进行预测、模拟等等。

虽然 EViews是由经济学家开发的,并且大多数被用于经济学领域,但并意味着必须限制该软件包仅只用于处理经济方面的时间序列。

EViews处理非时间序列数据照样得心应手。

实际上,相当大型的非时间序列(截面数据)的项目也能在 EViews中进行处理。

Eviews具有数据处理、作图、统计分析、回归建模分析、预测、时间序列ARIMA分析、时间序列的季节调整分析、编程和模拟九大类功能,包括建立数据文件、画图、一系列计假设检验、最小二乘估计、工具变量估计、两阶段最小二乘估计、离散选择模型(tobit、probit、logit、删载、截余、计数等模型)估计、联立方程模型估计、GARCH模型估计、时间序列ARIMA模型估计、向量自回归模型估计、向量误差修正模型估计、自相关检验、异方差检验、多重共线性检验、结构突变检验、单位根(时间序列平稳性)检验、Granger非因果性检验、协积检验、面板数据应用、Eviews编程和蒙特卡罗(MonteCarlo)模拟、主成分分析、时间序列的季节调整等内容。

与SAS相比,操作灵活简便,可采用多种操作方式进行各种计量分析和统计分析,数据管理简单方便。

Eviews的界面比较友好,使用简便。

为了使学生能够更加深刻地掌握时间序列分析理论和应用,本书在每一章的后面都有一节的内容介绍本章的分析方法在Eviews软件上的实现。

另外,本书的所有例题也是以Eviews软件为操作软件实现的。

习题一

1.1什么是时间序列?

请收集几个生活中的观察序列。

1.2时域方法的特点是什么?

1.3金融时间序列分析主要研究哪几个方面?

1.4什么是金融高频时间序列分析?

它主要研究哪些内容?

EVIEWS软件简介

Eviews(EconometricsViews),直译为计量经济学观察,通常称为计量经济学软件包。

它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。

计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、应用模型(结构分析、经济预测、政策评价)。

Eviews是完成上述任务比较得力的必不可少的工具。

一、Eviews基本简介

1、Eviews是什么

Eviews是专门开发用以处理时间序列数据的时间序列软件包的新版本。

Eviews的前身是1981年第1版的MicroTSP。

我们以Eviews5.1版本为例,介绍时间序列分析使用的基本方法和技巧。

Eviews处理的基本数据对象是时间序列,每个序列有一个名称,只要提及序列的名称就可以对序列中所有的观察值进行操作,Eviews允许用户以简便的可视化的方式从键盘或磁盘文件中输入数据,根据已有的序列生成新的序列,在屏幕上显示序列或打印机上打印输出序列,对序列之间存在的关系进行统计分析。

Eviews具有操作简便且可视化的操作风格,体现在从键盘或从键盘输入数据序列、依据已有序列生成新序列、显示和打印序列以及对序列之间存在的关系进行统计分析等方面。

2、Eviews的窗口简介

利用Eviews5.1安装包按提示安装完成后,使用Windows浏览器或从桌面上“我的电脑”定位Eviews目录,双击“Eviews”程序图标,就进入了Eviews操作界面。

Eviews的窗口上方按

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 文学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1