广东工业大学第三届大学生数学建模竞赛最终版.docx
《广东工业大学第三届大学生数学建模竞赛最终版.docx》由会员分享,可在线阅读,更多相关《广东工业大学第三届大学生数学建模竞赛最终版.docx(24页珍藏版)》请在冰豆网上搜索。
广东工业大学第三届大学生数学建模竞赛最终版
2011年广东工业大学第三届大学生数学建模竞赛
承诺书
我们仔细阅读了2011年广东工业大学数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛的题目是:
CPI中的数学模型
我们的参赛报名号为:
16
参赛队员(打印并签名):
姓名陈千文学号3110008367___参赛院系应用数学学院
姓名陈静旋学号_3210008502___参赛院系应用数学学院
姓名杜泽霖学号_3110008369___参赛院系应用数学学院
日期:
2011年4月24日
CPI中的数学模型
陈千文陈静旋杜泽霖
一、摘要
本文针对不同问题分别利用统计回归模型、线性相关系数方法、ARMA模型等,以我国2008年7月到2010年12月的居民消费指数为例建立合理的数学模型进行预测分析。
针对问题一,通过建立统计回归模型和以主成分分析法相结合分析各个指标的相关性,来说明影响CPI的主要三大因素及原因。
针对问题二,通过以线性相关系数方法来分析新增的五个因素(即房屋销售价格指数、固定资产购买价格指数、土地交易价格指数、国房景气指数和物业管理价格指数)的线性相关性,以及是否把居民住房消费指数纳入CPI的前后数据对比进行分析,找出充分有说服力的论据,从而说明不把居民住房消费指数纳入CPI的重要原因。
针对问题三,通过分析08年1月—11年3月CPI指数的统计数据,建立时间序列模型,对今年即2011年CPI指数的走势进行数据上的验证,并进行短期预测;并且建立ARMA模型对数据序列进行平稳性检验,看起是否具有季节性,来说明今年的通货膨胀及波动高度。
关键字:
CPI;居民住房消费;主成分分析法;线性相关系数;时间序列分析法
二、问题重述
消费者物价指数(ConsumerPriceIndex),英文缩写为CPI,是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。
一般说来当CPI>3%的增幅时我们称为Inflation,就是通货膨胀;而当CPI>5%的增幅时,我们把它称为SeriousInflation,就是严重的通货膨胀。
通货膨胀是指在一个国家或一个地区,大多数商品和劳务价格在一段时期内普遍的连续上涨。
通货膨胀的影响范围是广泛的,对全国的商品价格造成一定影响,持续的时间比较长。
通货膨胀将导致全面物价的上涨、对资源造成错误引导和破环金融资金体系的稳定性,对经济影响是全面的。
而CPI指数具有较强的时效性和国际可比性。
因此在分析和制定货币政策、价格政策、居民消费政策以及进行国民经济政策核算中发挥着十分重要的意义。
国家统计局2011年4月15日公布了今年一季度经济数据:
一季度居民消费价格同比上涨5.0%,其中3月份CPI同比涨幅是5.383%,环比下降0.207%。
此为2008年8月以来的32个月新高。
一季度居民消费价格同比上涨5.0%。
其中,城市上涨4.9%,农村上涨5.5%。
分类别看,食品上涨11.0%,烟酒及用品上涨2.0%,衣着上涨0.3%,家庭设备用品及维修服务上涨1.6%,医疗保健和个人用品上涨3.1%,交通和通信下降0.1%,娱乐教育文化用品及服务上涨0.6%,居住上涨6.5%。
3月份居民消费价格同比上涨5.4%,环比下降0.2%。
根据网站的数据建立相应的数学模型,在进行统计分析后回答以下几个问题:
1.从金融危机以来,影响CPI指数的主要因素有哪些?
写出三个影响最大的,并根据模型分析原因。
2.从数学模型的角度分析,是否应该把居民住房消费纳入CPI指数的统计范畴,如果需要,说明理由;如果不需要,阐明自己的观点。
3.根据模型预测今年CPI指数最高可以达到多少?
通货膨胀会持续多长时间?
什么时候开始能有所下降?
三、基本假设
1.由于不同地区、不同城乡的城市化进度是不同的,其消费水平也有所不同,故可以假设它们的经济水平是一样的。
2.我国的耕地面积短期内没有多大变化。
3.国际能源、粮食价格以及劳动成本与中国没多大的区别。
4.假设居民住房消费是CPI的一个指标(在4.2的情况)。
5.假设CPI是可预测的,在时间变化上具有连贯性。
6.假设在每个固定点的变化形势是可预测的。
四、符号说明
CPI:
居民消费价格指数
SP:
食品
YJ:
烟酒及用品
YZ:
衣着
JS:
家庭设备用品及服务
YB:
医疗保健及个人用品
JT:
交通和通信
JZ:
居住
YL:
娱乐教育文化用品及服务
COV(X,Y):
协方差
ρXY:
相关系数
五、模型的建立和求解
5.1影响CPI指数的主要因素
5.1.1统计回归模型
统计回归模型是在分析市场现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量,关系大多表现为相关关系。
因此,回归预测分析法是一个重要的市场预测方法,当我们在对市场现象未来发展状况和水平进行预测时,如果能将市场预测对象的主要因素找到,并且能够取得其数量资料,就可以采取回归分析预测法进行预测。
它是一种具体、行之有效、实用价值很高的常用市场预测方法。
因此,我们将它运用到CPI指数的预测当中。
5.1.2主成分分析法
在实际收集的数据中(表1.1-1.3和图1.1),我们发现各个数据变量之间有着一定的相关性。
主成分分析法是一种利用原始变量之间的相关性,通过原来变量的少数几个线性组合解释原来变量来实现降维的多元
我国近年CPI的增长形势统计方法。
在尽量少损失信息的前提下将多个指标转化为少数几个综合指标,通常将转化生成的综合指标为主成分。
5.1.3我国近年CPI的走势
中国经济表面上虽有着连续多年高速经济增长和持久低通胀的好现象,但事实上我国的通胀被种种因素压抑着。
通过以下数据对我国的CPI指数进行时间序列分析。
金融危机从07年开始,07年12月开始影响我国(也是这个时候股票开始狂跌),08年9月中央开始意识到危机,出台政策调控。
目前我国CPI指数统一执行国家统计局规定的“八大类”体系,即SP(34%)、YJ(4%)、YZ(9%)、JS(6%)、YB(10%)、JT(10%)、YL(14%)、JZ(13%)等八大类。
影响CPI指数的主要因素也为此八大类:
食品类,烟酒及用品衣着类,家庭设备用品及服务类,医疗保健及个人用品类,交通和通信类,娱乐教育文化用品及服务类和居住类。
经数据的整理与分析得出,影响最大的三个因素依次为:
食品类(SP),居住类(JZ),医疗保健及个人用品类(YB)。
下面是我们的模型建立与原因分析。
表1.1自金融危机以来,我国的CPI增长形势
1
2
3
4
5
6
半年
2008年
7.1
8.7
8.3
8.5
7.7
7.1
7.9
2009年
1.0
-1.6
-1.2
-1.5
-1.4
-1.7
-1.5
2010年
1.5
2.7
2.4
2.8
3.1
2.5
2.5
7
8
9
10
11
12
全年
2008年
6.3
4.9
4.6
3.9
2.4
1.2
5.9
2009年
-1.8
-1.2
-0.8
-0.5
0.6
1.9
-0.8
2010年
3.3
3.5
3.6
4.4
5.1
4.6
3.3
由以上表格我们可以看出:
07年尾,金融危机开始影响我国CPI指数高企,08年全年平均更是达到同比增长率5.9%。
中央意识到危机后,采取了货币紧缩政策,开始控制CPI的异常增长。
到了2010年,开始保持良好态势,稳定增长,利好经济发展,全年保持在5%以内的增长率。
5.1.4数据处理与分析
1.描述性分析如下:
图1.108-10年八大类因素的价格指数走势
表1.22008.1—2010.12CPI及其分类价格指数描述性统计分析(单位:
%)
最高位
最低位
均值
标准差
全距
CPI
5.9
-0.7
2.8
3.3
6.6
SP
14.3
0.7
7.4
6.8
13.6
YJ
2.9
1.5
2.0
0.7
1.4
YZ
-1.0
-2.0
-1.5
0.5
1.0
JS
2.8
0.0
1.0
1.6
2.8
YB
3.2
1.2
2.4
1.1
2.0
JT
-0.4
-2.4
-1.2
1.1
2,0
YL
0.6
-0.7
-0.3
0.8
1.3
JZ
5.5
-3.6
2.1
5.0
8.1
由表1.2得知:
自金融危机以来,CPI平均值为2.8%,全距为6.6%,标准差为3.3%。
从八大构成要素波动情况来看,食品以均值7.4%、标准差6.8%及全距13.6%位居首位,SP(食品类)价格指数显然是影响CPI波动的最关键因素;同样,JZ(居住类)分别为均值2.1%、标准差5.0%及全距8.1%位居第二,成为第二关键因素;最后,YB(医疗保健及个人用品类)分别为均值2.4%、标准差1.1%及全距2.0%位居第三,成为第三大影响因素。
2.相关性分析如下:
表1.32008.1—2010.12各构成因素与CPI相关性统计分析
CPI
SP
YJ
YZ
JS
YB
JT
YL
JZ
CPI
1
0.9591
0.3109
0.2511
0.2686
0.7620
0.2779
0.0153
0.8560
SP
0.9591
1
0.2831
0.1458
0.2760
0.6138
0.1300
0.00007
0.6934
YJ
0.3109
0.2831
1
0.0005
0.8229
0.0837
0.1058
0.0820
0.2617
YZ
0.2511
0.1458
0.0005
1
0.0279
0.5208
0.4564
0.1596
0.4660
JS
0.2686
0.2760
0.8229
0.0279
1
0.0706
0.0127
0.0749
0.1688
YB
0.7620
0.6138
0.0837
0.5208
0.0706
1
0.4828
0.2485
0.8832
JT
0.2779
0.1300
0.1058
0.4564
0.0127
0.4828
1
0.3081
0.5843
YL
0.0153
0.00007
0.0820
0.1596
0.0749
0.2485
0.3081
1
0.1008
JZ
0.8560
0.6934
0.2617
0.4660
0.1688
0.8832
0.5843
0.1008
1
从表1.3相关性分析结果看出:
其相关性从大到小依次是SP、JZ、YB、YJ、JT、JS、YZ、YL。
即前3位影响因素依次为:
食品类,居住类,医疗保健及个人用品类。
3.最新走势
表1.42010年1-3月CPI及各构成因素变动走势(%)
CPI
SP
YJ
YZ
JS
YB
JT
YL
JZ
一月
4.9
10.3
1.8
-0.2
1.4
3.2
-0.1
1
6.8
二月
4.9
11
1.9
0.4
1.4
3
-0.3
0.3
6.1
三月
5.4
11.7
2.1
0.8
1.9
3.2
0.1
0.5
6.6
从表1.4发现:
食品价格上涨仍是最主要的因素。
加之考虑到各因素权重问题,可知前3位影响因素依次是:
SP,JZ,YB。
即为:
食品类,居住类,医疗保健及个人用品类。
综合上述:
从金融危机以来,影响CPI指数三个影响最大的主要因素依次为:
食品类(SP),居住类(JZ),医疗保健及个人用品类(YB)。
5.2CPI与居民住房消费的关系
居民住房消费是个大宗指数,包括很多方面。
目前,据国际统计局最新公布,居住类消费包括:
建房及装修材料、水电材料、房租和自有住房四个细类。
现在,我们在建模过程中新增五个居民住房消费的细类:
房屋销售价格指数,固定资产购买价格指数、土地交易价格指数、国房景气指数和物业管理价格指数。
其中,对于居民住房消费,激烈争论一直存在。
尤其是房屋销售价格指数,更是一直被群众热捧,要求加入CPI的统计范畴,而国家统计局则以该行为是投资而不是消费为由予以拒绝。
5.2.1居民消费指数与CPI的相关性分析
下面,我们以数学建模角度分析,运用线性相关系数方法来研究其相关性。
相关系数的描述:
设变量Y为CPI同比增长率(季度制),Xi(i=1,2,3,4,5)分别为房屋销售价格指数,固定资产购买价格指数、土地交易价格指数、国房景气指数和物业管理价格指数。
则协方差为:
COV(X,Y)=E(X-EX)(Y-EY)//E为数学期望
则相关系数为:
ρXY=
实际中,人们总是用相关系数ρXY,而不用协方差COV(X,Y)来判断2个变量X与Y之间的线性相关程度。
若ρXY越大,则相似的程度越高,线性相关的程度也越高,否则结论相反。
表1.5居民住房消费与CPI的相关系数
房屋销售价格指数
固定资产购买价格指数
土地交易价格指数
国房景气指数
物业管理价格指数
Cov(X,Y)
8.357
13.511
9.989
6.507
0.049
EX
1.329
14.942
26.098
10.501
0.344
ρXY
6.286
0.904
0.383
0.620
0.142
从表1.5可以看出:
房屋销售价格指数与CPI有较大相关性,除此之外,另外的四项相关性较低,都是小于1个相关性。
可见,这五项所代表的居民住房消费与CPI的相关性总体不高,说明了居民住房消费纳入CPI指数的统计范畴的意义不大。
5.2.2居民消费指数纳入CPI前后的各分类权数的比较
除了使用相关系数法以外,我们还分析了这五项为代表的居民住房消费在CPI中的权重问题,以下为居民住房消费指数纳入居住类消费,CPI指数前后的各分类权数的比较:
1)纳入之前
2)纳入之后
根据图1.2和图1.3的数据对比分析,纳入前后的八大类指数的变化范围不明显,而且CPI只能反映与居民当期消费密切相关的消费品及服务项目的价格变动,不能反映房地产和股票等资产类价格的变动。
之所以不能将商品房价格直接纳入CPI统计中,主要有三个原因:
一是出于国民经济核算的需要,CPI的统计口径必须与国民经济核算体系中的消费分类相一致,根据这个分类,商品房购买属于投资范畴,不属于消费行为。
二是商品房购买与当期消费不同步,购买支出与当期实际住房消费不对等。
三是商品住宅在某种意义上也是一种金融资产。
它被许多金融投资机构吸纳到其投资融合之中。
事实上,如果真的将商品住宅销售价格直接纳入CPI的统计范围,由于商品住宅的投资性质,特别是金融投资性质,其决定因素太多(包括市场投机因素),极易引起波动,这必将导致CPI的大幅波动,这对于我们观察宏观经济形势,对于我们根据CPI决定工资和养老金等补贴的变动等都是极其不利的。
当然,这并不是说居民居住消费价格的变动不需要在CPI中得到反映。
恰恰相反,目前我国和世界各国的CPI都包括了居民居住消费的相关商品和服务的价格。
居民住房的房租、水、电、燃料、购买商品住宅贷款利率、住房维护修理费用、建房及装修材料等的价格,这些商品和服务等价格的变动,特别是房租的变动,可以反映居民居住消费价格变动的情况。
5.3通货膨胀的持续时间及波动高度
5.3.1模型的建立
现在通过分析08年1月—11年3月CPI指数的统计数据,建立时间序列模型,对今年即2011年CPI指数的走势进行数据上的验证,并进行短期预测。
时间序列分析方法很多,本次数学建模主要建立了ARMA模型即自回归移动平均模型的方法。
ARMA模型是一类常用的随机时序模型,只有平稳的时间序列才能直接建立此模型,这就要求时间序列γi满足:
(1)对任意时间t,其均值为常数;
(2)对任意时间t和s,其自相关系数只与时间间隔t-s有关,而与t和s的起始点无关。
这样时间序列γi的统计特征不随时间推移而变化,称为平稳时间序列。
要想建立平稳时间序列γi的ARMA模型,其具体形式如下:
γi=Φiγi-1+Φ2γi-2+……+Φpγi-p+e1-θ1ei-1—θ2ei-2-……-θqei-q
其中γi=Φiγi-1+Φ2γi-2+……+Φpγi-p+e1为p阶自回归序列,记作AR(p),待估参数Φ1,Φ2,……,Φp称为自回归系数;γi=e1-θ1ei-1—θ2ei-2-……-θqei-q为q阶移动平均系数,是模型的待估参数。
通常情况下,自回归移动平均模型的建模过程分为以下几个步骤:
(1)对原序列进行平稳性检验,若非平稳序列则通过差分消除趋势;
(2)判断序列是否具有季节性,若序列具有季节波动,则通过季节差分消除季节性;
(3)对序列进行自相关与偏自相关分析,确定阶数P、q建立ARMA(P,q)模型;
(4)对ARMA模型的适合性进行检验,即对残差序列进行白噪声检验
下面将以我国08年1月一11年3月居民消费价格指数的数据为例建立模型进行检验。
首先在Eviews软件中建立工作文件,将表1中08年-11年的CPI指数数据绘制成时序图(见图1.4)。
序列具有一定的趋势,并且由序列的自相关图可知序列是非平稳的。
表1.608年-11年我国的CPI指数
年度
1月
2月
3月
4月
5月
6月
7月
8月
9月
10月
11月
12月
2008
107.1
108.7
108.3
108.5
107.7
107.1
106.3
104.9
104.6
103.9
102.4
101.1
2009
100.9
98.4
98.8
98.4
98.6
98.6
98.1
98.7
99.2
99.4
100.6
101.9
2010
101.5
102.7
102.4
102.8
103.1
102.9
103.3
103.4
103.6
104.3
105.1
104.5
2011
104.9
104.9
105.4
图1.4消费者物价指数时序图
为消除序列的趋势同时减少序列的波动,有必要对原有时间序列做一阶逐期差分,并绘制差分后的时序图(见图1.5)。
可以看出经过差分处理后的序列趋势基本上消除。
图1.5消费者物价指数一阶差分后时序图
为了更好地描述月度数据时间序列并进行模拟,需对该序列再进行季节差分,进一步消除季节性。
经试验可知二阶季节差分并没使季节性得到显著改善,故仅对序列做一阶季节差分(见图1.6)。
图1.6.消费者物价指数一阶季节差分后时序图
以下是Eviews软件对处理后平稳的序列进行自相关与偏相关的分析(表2),
表1.7自相关函数与偏相关函数的数据统计
AC
PAC
Q-Stat
Prob
1
-0.615
-0.615
12.135
0.000
2
-0.046
-0.681
12.205
0.002
3
0.583
0.351
23.966
0.000
4
-0.775
-0.378
45.578
0.000
5
0.343
-0.578
49.974
0.000
6
0.189
-0.590
51.373
0.000
7
-0.459
-0.110
59.972
0.000
8
0.491
0.223
70.284
0.000
9
-0.141
0.018
71.183
0.000
10
-0.143
0.468
72.152
0.000
11
0.152
0.181
73.299
0.000
12
-0.139
-0.005
74.325
0.000
5.3.2模型预测
利用自相关函数与偏相关函数的统计特性初步判断建立时间序列ARMA模型的p、q阶数。
通过运行Eviews软件可以直接得到数据的短期预测值,
EstimationCommand:
ARCH(DERIV=AA)CPI
CEstimationEquation:
CPI=C
(1)
GARCH=C
(2)+C(3)*RESID(-1)^2+C(4)*GARCH(-1)
SubstitutedCoefficients:
CPI=3.07776368GARCH=0.04624470001+1.27706221*RESID(-1)^2+0.03067279743*GARCH(-1)
从forecastofvarlance和CPIF图中可以预测,CPI趋势平缓,而在图中尽头可见为103.07776368。
因此预测今年最高峰的CPI指数会在105%上下徘徊,通货膨胀(即CPI>3%时),会持续半年的态势,预测到下半年会开始有所下降。
六、模型的结果分析与评价
一方面,建立统计回归模型和以主成分分析法相结合分析各个指标的相关性,能够有力说明影响CPI的主要三大因素及原因;另一方面,通过以线性相关系数方法来分析新增的五个因素之间纳入前后的权数变化,有效说明不把居民住房消费指数纳入CPI的重要原因。
对于本文运用的ARMA模型:
1)优点
第一,预测时不必考虑其它因素的影响,仅从系列自身出发,建立相应的模型进行预测,从根本上避免了寻找影响因素及识别主要因素和次要因素的困难。
第二,与回归分析相比,可以避免因果模型中对随机扰动项(剩余项)的限定条件在经济实践中难以满足的矛盾。
第三,时序模型简单易行,资料容易取得,应用广泛。
2)局限性从时间序列自身出发,难以准确地预测到转折点的出现。
七、参考文献
[1]隋娟娟,《我国通货膨胀原因的相关性分析》,青岛广播电视大学,266012。
[2]王军平,《住房价格上涨对CPI的传导效应——兼论我国CPI编制体系的缺陷》,中国人民大学经济学院,北京,100872。
[3]战雪丽,张世英,张瑞锋,《金融市场相关性分析及其度量方法改进》,长安大学学报,第8卷第1期:
2006年。
[4]张莉,牛惠芳《时间序列分析方法在居民消费价格指数预测中的作用》,洛阳师范学院数学科学学院,河南洛阳,