数学建模《成品油价格与家庭汽车》第16队.docx
《数学建模《成品油价格与家庭汽车》第16队.docx》由会员分享,可在线阅读,更多相关《数学建模《成品油价格与家庭汽车》第16队.docx(21页珍藏版)》请在冰豆网上搜索。
数学建模《成品油价格与家庭汽车》第16队
成品油价格与家庭汽车
摘要
随着汽车行业的兴起,汽车越来越成为百姓生活必需品,然而节节攀升的油价给人们的生活消费带来了负面影响。
在此题中我们根据搜集影响成品油价格因素等实际数据对有关成品油价格与家庭汽车的一些问题建立数学模型进行讨论。
对于问题一,对于此问我们首先确立了可能影响成品油价格的因素,我们认为可能影响成品油价格的因素有:
中国原油生产量
、中国原油进口量
、中国原油出口量
以及国际原油价格
等。
在假设各个变量之间没有多重共线性的情况下,我们先用最小二乘法对其进行多元线性回归,最终结果未能通过显著性检验。
在此情况下我们对各个变量进行了多重共线性检验,列出了各个变量间的相关系数矩阵发现变量之间具有相关性,即原假设不成立,变量之间存在多重共线性。
为了修正多元共线性给模型带来的误差,接下来我们运用逐步回归的方法得出了最终该结果:
并根据此模型预测2016年国内成品油价格为11296.3(元/吨)。
对于问题二,分析家庭汽车数量我们认为影响长沙市家庭汽车数量因素有:
1成品油价格(元/吨)x1、2人均可支配收入(元)x2、3人口数量(人)x3、4普通小汽车的价格指数x4、5居民消费指数x5以及6城市公交车乘坐人次(人)x6。
由此建立统计回归模型,最终得到模型为:
运用此模型预测得2020年长沙市家庭汽车数量大概为1589400辆。
对于问题三,我们讨论了GPI与国内成品油价格的关系,通过对其进行一元线性回归得到结果如下:
对我国成品油价格定价机制来说GPI每增长1个点成品有价格就增加0.1715元/升。
第四问中我们根据上述三问所建立的模型给给国家发改委提出中国成品油定价机制的建议有:
宏观调控,放开价格;适当缩短成品油调价时间间隔,让其能够及时的反映成本,进一步向市场化迈进;成品油定价时要充分考虑GPI等等
关键词:
最小二乘法、多元线性回归、多重共线性检验、逐步回归
一、问题重述
1.1问题背景:
经济发展与人民生活息息相关。
油价的上涨引起了广大消费者的不满,对我国现行的成品油定价机制产生了质疑。
因此,成品油的合理定价对国家经济发展及社会和谐稳定具有重要的现实意义。
我们就长沙市家庭汽车、影响成品油价格因素等实际数据对有关成品油价格与
家庭汽车的一些问题建立数学模型进行讨论。
1.2待解决问题:
1、分析影响中国成品油价格的因素,建立数学模型,并预测到2016年中国成品油价格情况。
2、对家庭汽车数量的增长给出数学模型,并预测到2020年家庭汽车的发展前景,说明成品油价格对家庭汽车增长的影响。
3、分析国外成品油价格的定价因素,给出一份适合中国国情的成品油定价模型。
4、根据你所建立的模型,给国家发改委提出中国成品油定价机制的建议。
二、问题分析
2.1第一问:
分析影响中国成品油价格的因素,建立数学模型,并预测到2016年中国成品油价格情况。
对于此问我们首先确立了可能影响成品油价格的因素。
我们认为可能影响成品油价格的因素有:
中国原油生产量、中国原油进口量、中国原油出口量以及国际原油价格等。
对于家庭汽车数量这个因素,常识中我们只听说过油价影响汽车,没有听过汽车影响油价,并且我们通过资料查询,发现成品油价格必将影响家庭汽车数量,但家庭汽车数量不是影响成品油价格的因素。
所以我们假设家庭汽车数量不作为影响因素。
我们通过查阅资料得到从2006到2012年各个因素的具体数据。
有了数据后我们便开始进行解题。
关于本题我们以成品油价格为因变量,以中国原油生产量、中国原油进口量、中国原油出口量以及国际原油价格为自变量进行回归分析。
多元回归分析我们首先要考虑自变量与自变量之间是否存在相关关系即多重共线性,对于此题我们先假设各个自变量之间相互独立对其用最小二乘法进行多元线性回归,但自变量间可能存在多重共线性。
为了避免多重相关性给模型带来的误差,我们接下来运用逐步回归法对各个变量进行了回归进而得到了比较准确的模型,然后我们根据模型对2016年的成品油价格进行了预测。
2.2第二问:
是对家庭汽车数量的增长给出数学模型,并预测到2020年家庭汽车的发展前景,说明成品油价格对家庭汽车增长的影响。
家庭汽车数量增长的影响因素可能有:
城镇居民人均可支配收入、长沙市人均GDP、国内成品油价等因素。
此问中我们对2006到2012年的数据进行汇总作为解题数据并进行量纲化处理。
考虑到问题一中的多重共线性我们运用主成分估计法对各个因素进行分析进而建立起模型。
有了家庭汽车数量增长模型后,然后我们对2020年的家庭汽车发展前景进行了预测。
对于成品油价格对家庭汽车的影响我们通过对模型式对国内成品油价格做偏导数进而给出其间的关系。
2.3第三问:
我们分析了解了国外很多国家的成品油定价机制,通过此为基础对我国成品油定价进行研究。
国内成品油价格受多种因素的影响:
国际原油价、国内GPI、成品油出口量、成品油供应量、成品油市场需求、成品油进口量、国内GDP增长、国内原油产量、国内原油成本等因素。
在充分查阅资料的情况下通过查阅文献得出,在影响成品油价格的因素中,CPI所占权重比较大,下面我们就只讨论GPI对成品油定价的影响。
首先我们画出两者之间的残差图,通过残差图我们发现国内原油价格与GPI具有正相关关系,然后我们运用一元线性回归进行建立模型。
三模型假设
3.1假设该论文所参考的数据真实可靠。
3.2在单位换算时候不考虑因汇率不同所带来的影响。
3.3忽略短时间内家庭汽车数量对成品油价格的影响。
3.4在模型可以预测的时间范围内,不发生重大的变故(如:
全球经济危机,大型战争,重大
的自然灾害),以及不会出现家庭汽车交通工具的替代品。
3.5在模型可以预测的时间范围内,家庭汽车的数量不会达到市场容量的饱和点。
3.6假设1年内的各月的轻微变化会在求和时相互抵消,使得数据在以年为跨度时
相对稳定。
四符号说明
4.1问题1:
…………中国原油产量(万吨)
…………中国原油进口量(万吨)
…………国际原油价(元/吨)
…………中国原油出口量(万吨)
4.2问题2:
y…………长沙市汽车保有量(辆)
x1…………成品油价格(元/吨)
x2…………人均可支配收入(元)
x3…………人口数量(人)
x4…………普通小汽车的指数
x5…………居民消费指数
x6…………城市公交车乘坐人次(万人)
4.3问题3:
五模型建立与求解
问题一:
5.1.1多元线性回归求解
此问中我们采取了中国原油生产量
、中国原油进口量
、中国原油出口量
以及国际原油价格
作为影响因素对国内成品油价格y建立数学模型。
下表是我们所查的数据:
表一
年份
中国原油产量(万吨)
中国原油进口量(万吨)
国际原油价(元/吨)
中国原油出口量(万吨)
国内成品油价(元/吨)
2006
18476.57
14517
3920.79
634
5180.16
2007
18631.82
16316
4241.04
389
5480.00
2008
19043.06
17888
4452.25
424
5866.67
2009
18948.96
20365
3429.69
507
6518.57
2010
20241.40
23768
4063.45
303
7440.00
2011
20287.55
25378
4426.57
252
8313.33
2012
20747.80
27103
4356.54
243
8565.71
在假设各个自变量间相互独立即解释变量之间不存在多重共线性的前提下,我们建立多元线性回归模型:
将表一数据代入matlab中求得:
(源程序及结果见附件1)
R2=0.0001F=0.0063P=0.0000
通过对比各个相关系数的临界表发现参数完全无法通过检验故自变量之间可能存在多重共线性。
此模型不成立。
5.1.2多重共线性的分析
我们以实际问题为参考,很显然在我们假设的几个因数中有存在相关性,例如中国原油出口量和中国原油进口量之间必然存在很大的相关性,又如中国原油产量与中国原油进口量,它们之间必然存在很大的联系,在统计学中我们称之为多重共线性。
多重共线性是多元回归分析中一类比较复杂的问题,由于它的存在,会消弱回归系数估计值的准确性和艳定性,从而给经济分析和预测带来很大的误差。
所谓多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。
为了为解决多重共线性所带来的误差,我们接下来用逐步回归方法进行修正。
5.1.3逐步回归法修正多重共线性
逐步回归的基本思想是,从当前在圈外的全部变量中,挑选其偏回归平方和贡献最大的变量,用方差比进行显著性检验的办法,判别是否选入;而当前在圈内的全部变量中,寻找偏回归平方和贡献最小的变量,用方差比进行显著性检验的办法,判别是否从回归方程中剔除。
选入和剔除循环反复进行,直至圈外无符合条件的选入项,圈内无符合条件的剔除项为止。
在逐步回归计算中需要用到线性代数中的消去变换法进行变量的选入。
对选入变量的回归系数进行显著性检验,剔除变量仍进行F-检验。
经过若干次选入变量和剔除变量之后,所有变量再没有可入选或剔除的,选择变量的步骤停止,整理资料,得出回归方程。
逐步回归法由于剔除了不重要的变量,因此,无需求解一个很大阶数的回归方程,显著提高了计算效率;又由于忽略了不重要的变量,避免了回归方程中出现系数很小的变量而导致的回归方程计算时出现病态,得不到正确的解。
在解决实际问题时,逐步回归法是常用的行之有效的数学方法。
逐步回归的计算一般需借助计算机计算。
下面我们运用matlab(程序见附录二)进行逐步回归得到以下结果:
图一逐步回归分析结果图
从新的统计结果可以看出,虽然剩余目标差没有太大变化,但是统计量F的值明显增大,因此新的回归模型更好一些。
由此可以求出最终的模型为:
5.1.42016国内成品油价格的预测
接下来我们分别以中国原油生产量和中国原油进口量对时间进行一元线性回归建立这两个变量关于时间的模型。
利用matlab进行线性回归得到(相关程序见附录三):
从上述各个参数的值可以看出线性回归得到的模型较好。
接下来我们利用此模型对2015年的中国原油产量、中国原油进口量的值进行预测。
2016年:
3.6808(亿吨)
由式3得:
11296.3(元/吨)
问题二:
5.2.1数据查询
分析家庭汽车数量我们认为影响长沙市家庭汽车数量因素有:
1成品油价格(元/吨)x1、2人均可支配收入(元)x2、3人口数量(人)x3、4普通小汽车的价格指数x4、5居民消费指数x5以及6城市公交车乘坐人次(人)x6。
下表是我们所查的数据:
年份
长沙市汽车保有量
(辆)
成品油价格(元/吨)
人均可支配收入(元)
人口数量(人)
2005
126289
4980.24
12434
6209248
2006
163162
5180.16
14788
6309958
2007
221801
5480
16963
6373561
2008
290783
5866.67
18282
6417367
2009
403195
6518.57
20864
6468350
2010
546834
7440
23347
6501248
2011
689957
8313.33
27069
6566185
2012
856813
8565.71
31044
6606166
5.2.2图像化处理
我们将y与x1、x2、x3之间的关系用散点图表示出来
图三
图四
图5
于是,通过分析,对x1,x2,x3建立以下模型
y=a+a2*x1+ε
y=b+a3*x2+ε
y=c+a4*x3+a5*x4^2+ε
所以
综合上述分析,建立以下回归模型
y=b1+b2*x1+b3*x2+b4*x3+b5*x3^2+ε
5.2.3模型求解(matlab程序见附录4)
[b,bint,r,rint,stats]=regress(y,x)
参数
参数估计值
参数置信区间
a1
0
[00]
a2
66.284
[19.384113.18]
a3
40.859
[26.53855.179]
a4
0.40967
[0.0532630.76607]
a5
-8.4529*10^(-8)
[-1.4346e-07-2.5592e-08]
F=1306p<0.0001
5.2.4结果分析
指因变量y(家庭汽车保有量)的99.898%可由模型确定,F值远远超过F检验的临界值,p远远小于置信水平α,因而模型整体上来看是可用的。
表二给出了模型a1,a2,a3,a4,a5的估计值,即a1=0,a2=66.284,a3=20.859,a4=0.40967,a5=-8.4529*10^(-8),检查它们的置信区间发现,只有参数a1的置信区间内包含0点,但其估计值为0,所以可以不予考虑。
另外,发现参数a5的估计值几乎接近于0,但由于x4的平方本身数值较大,所以仍然将变量x4^2保留。
5.2.5家庭汽车数量预测
将回归系数的估计值带回模型,得到模型方程:
y=66.284*x1+40.859*x2+0.40967*x3-0.0000000845*x3^2
要预测2020年家庭汽车的数量,需先将x1与t建立一元线性回归方程,预测x1(成品油价格)在2020年的数值,x2与t建立一元线性回归方程,预测x2(人均可支配收入)在2020年的数值,x3与t建立一元线性回归方程,预测x3(人口数量)在2020年的数值。
x1=563.05*t-1124300
x2=2540.6*t-5082200
x3=53495*t-101010000
所以当t=2020时,x1=13061;x2=49812;x3=7049900
所以可以进行预测
当t=2020时,y=1589400辆
问题三:
5.3.1关于国外国内成品油价格的定价因素。
目前,世界各国国内市场成品油价格的形成机制主要有市场竞争形成价格和国家定价两种。
但市场化是全球成品油定价的主流模式和发展趋势。
全球绝大多数国家都实行市场化的成品油定价机制,成品油由府定价的国家越来越少。
美国国内成品油销售划分为三种情况,无论以哪种方式销售,其最终价格都是由市场来决定的。
同时,美国成品油零售价又视地区和季节的不同而有所不同,各石油公司每天都要制定各个油库的成品油批发价格。
美国汽油随行就市的一个主要原因是它的成本构成中原油成本占据主要部分。
按照美国能源部近年的统计,汽油平均成本中,55%是原油,22%是炼油环节,19%是税收,4%是批发和营销。
比利时是个典型的“无油国”,但是比利时政府、企业和消费者面对居高不下的油价却并不惊慌,原因就在于比利时独特的燃油定价机制。
在比利时,燃油零售价中共包括四个部分的费用:
一是进口成本价;二是经销商的利润;三是消费税;四是增值税。
其中,消费税相对固定,而增值税则是前三项之和再乘以一个固定的比例。
韩国石油价格市场化进程和我国类似,经历了政府定价、与国际市场接轨和价格放开三个阶段。
1994年开始,与国际市场价格接轨,先是建立与国际市场原油价格联动机制,然后建立与国际市场成品油价格联动机制,并于1997年开始,石油价格完全市场化。
日本的石油价格在1996年之前由政府严格控制,1996年后,石油市场逐渐开放,目前成品油价格主要由市场竞争形成,日本政府不再采取行政手段来控制市场价格。
据查阅资料知国内成品油价格受多种因素的影响:
国际原油价、国内GPI、成品油出口量、成品油供应量、成品油市场需求、成品油进口量、国内GDP增长、国内原油产量、国内原油成本等因素。
种因素联系交叉混杂,互为关联,在研究中很多问题只能定性分析,很难得出定量的结果,通过查阅文献得出,在影响成品油价格的因素中,CPI所占权重比较大,下面我们就只讨论GPI对成品油定价的影响。
5.3.2运用线性回归建立模型
通过查询资料我们得到从2009年1月到2012年93#汽油和GPI变化情况,具体数据如表六所示:
表六
日期
2009
.06
2009
.07
2009
.09
2009
.11
2010
.04
2010
.06
2010
.10
2010
.12
2011
.02
2011
.04
2011
.10
93#价格(元/升)
5.89
6.21
6.43
6.66
6.92
6.74
6.92
7.14
7.42
7.85
7.61
GPI
98.3
98.2
99.2
100.6
102.8
102.9
104.4
105.1
104.9
105.3
105.5
运用matlab画出数据散点图如图二所示:
图二93#汽油价格与GPI散点图
由散点图可知二者存在正相关关系,接下来我们运用matlab对其进行线性回归得到如下结果(程序见附录五):
其残差分布图如图三所示:
图四残差分布图
从残差图可以看出数据的残差离零点的远近,残差的置信区间均包含零点,这说明回归模型能较好的反映原数据。
由建立的回归模型证明了GPI对成品油价格的影响:
GPI每增长1个点成品有价格就增加0.1715元/升。
最终模型为:
问题四:
根据我们所建立的模型对给国家发改委提出中国成品油定价机制的建议如下:
中国现行的成品油定价机制参考的主要是国际原油价格走势,却唯独忽略了国内成品油供需情况的变化。
中国现行的价格管理办法是与国际石油市场挂在一起的,但与国内的石油市场是相对脱节的,也就是说,价格测算公式里没有考虑任何国内市场因素。
这就造成了当前国内成品油供应紧张,按照“调价规则”却需要降价的矛盾。
新的定价机制需要内外兼顾。
5.1增强我国在国际油价制定过程中的话语权。
作为世界第二大石油消费国,近年来我国原油对外依存度逐年攀升,国际油价对国内市场的影响越来越明显,增强国际油价话语权愈发迫切主动参与国际油价定价过程,改变仅仅做一个被动的价格接受的局面,这样才能从根源上确保国内石油安全,实现可持续发展目标。
5.2宏观调控,放开价格。
目前,世界各国国内市场成品油价格的形成机制主要有市场竞争形成价格和国家定价两种。
但市场化是全球成品油定价的主流模式和发展趋势。
全球绝大多数国家都实行市场化的成品油定价机制,成品油由政府定价的国家越来越少。
国家应对成品油价格由直接管理转为间接管理,不再确定具体中准价水平,国内成品油价格完全由各经营主体在市场竞争中形成。
5.3为配合价格的放开,今后应该进一步加强国家对市场的保障调控机制,明确将石油储备分为国家储备与市场储备;研究制定石油法规,在明确国家能源发展战略的基础上,建立起责权相互统一、真正平等竞争的市场规则;恢复国内原油、成品油期货市场,建立中国的石油报价系统。
5.4适当缩短成品油调价时间间隔,让其能够及时的反映成本,进一步向市场化迈进。
在参考国际原油价格走势的同时,也应该考虑我国成品油供需情况及我国国情。
我国的成品油定价机制不应该是推波助澜的价格跟随者,而应该作为市场的稳定器,当国际油价走势与国内供需出现矛盾时,应通过调节储备将成品油价格保持在一个相对稳定的水平。
六模型的改进与优化
6.1成品油价与家庭汽车前两个问题是对成品油价格和家庭汽车建立模型预测它们未来的情况,对于这两个问题我们用回归分析的方法解决。
第一问通过查资料找到影响成品油的价格的诸多因素,利用多元线性回归和逐步回归在
P显著性检验满足要求时找出自变量和因变量的关系,用一元线性回归预测出2016年的自变量进一步预测出因变量。
模型的缺点是没有考虑一些定性因素对成品油价的影响,模型进一步优化时可以找出这些定性因素,把定性因素定量化更准确的预测出2016的数值。
6.2在第二问中,我们发现成品油价格对家庭汽车增长具有促进作用,不符合常理。
有必要修改确定因素或者改变建立模型的方法。
七 参考文献
[1]胡晓东董辰辉,MATLAB从入门到精通,北京:
人民邮电出版社,2010.6
[2]姜启源谢金星叶俊,数学建模,北京:
高等教育出版社,2003.8
[3]XX文库
[4]海舟,借鉴国外成品油价格形成机制,
[5]中国统计局,长沙市统计局
八 附录
附录一:
Matlab程序
clc
clear
x=[18476.57,14517,3920.79,634;
18631.82,16316,4241.04,389;
19043.06,17888,4452.25,424;
18948.96,20365,3429.69,507;
20241.40,23768,4063.45,303;
20287.55,25378,4426.57,252;
20747.80,27103,4356.54,243;];
Y=[5180.16;
5480.00;
5866.67;
6518.57;
7440.00;
8313.33;
8565.71;];
X=[ones(length(x),1),x];
[b,bint,r,rint,stats]=regress(Y,X,0.05)
运行结果:
b=
685.2643
-0.2194
0.3579
0.5370
1.8012
bint=
1.0e+04*
-3.08973.2268
-0.00030.0002
-0.00000.0001
-0.00020.0003
-0.00060.0010
r=
105.3862
64.6985
-197.5227
-53.1814
-39.0864
164.9670
-45.2612
rint=
-9.6996220.4719
-363.8167493.2137
-554.5836159.5381
-88.7933-17.5694
-515.0704436.8977
-387.6056717.5395
-922.8896832.3672
stats=
1.0e+04*
0.00010.00630.00004.3963
附录二:
Matlab程序
x0=[18476.57145173920.796345180.16
18631.82163164241.043895480.00
19043.06178884452.254245866.67
18948.9620