西安交大统计学时间序列作业.docx
《西安交大统计学时间序列作业.docx》由会员分享,可在线阅读,更多相关《西安交大统计学时间序列作业.docx(19页珍藏版)》请在冰豆网上搜索。
西安交大统计学时间序列作业
西安交通大学管理学院
统计学习题
时间序列作业报告
2013/4/13
1.1974年——1993年间美国历年从欧佩克进口的石油量(以百万桶为单位),数据见文件:
美国历年从欧佩克进口的石油量。
a.请计算从欧佩克年石油进口量的3点移动平均值。
b.利用平滑常数α=0.3,计算从欧佩克年石油进口量的指数平滑序列。
c.用移动平均法预测1995年从欧佩克进口的石油量。
d.用α=0.3的指数平滑法预测1995年从欧佩克进口的石油量。
解:
a.使用excel软件计算如下:
因此,石油进口量的3点移动平均值如上图所示。
b.使用excel软件,阻尼系数为1-0.3=0.7,得到以下结果:
第E列中的数据即为采用指数平滑分析得到的指数平滑序列。
c.使用excel软件,计算结果如下:
由此,用移动平均法预测1995年从欧佩克进口的石油量为1339(百万桶)。
d.如c中图示,用α=0.3(阻尼系数为0.7)的指数平滑法预测1995年从欧佩克进口的石油量为845.8756(百万桶)。
2.1982---1991年间美国城市间长途汽车运输公司所创造的总收入,数据见文件:
长途汽车运输公司总收入。
a.试对总收入提出一个考虑长期趋势的回归模型。
b.画出数据的散布图,你能否识别出这一时间序列中的趋势成份。
c.将A中的模型与数据拟合。
这个模型对预测收入是否合适?
d.预测1993年城市间长途汽车公司的总收入。
求出两个95%预测区间。
解:
a.做普通回归分析,建立公司总收入与时间的线性回归方程。
使用spss软件,运行结果如下:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
dimension0
1
年份a
.
输入
a.已输入所有请求的变量。
b.因变量:
收入
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.627a
.393
.317
59.306
1.682
a.预测变量:
(常量),年份。
b.因变量:
收入
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
18219.103
1
18219.103
5.180
.052a
残差
28137.297
8
3517.162
总计
46356.400
9
a.预测变量:
(常量),年份。
b.因变量:
收入
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
30350.994
12970.546
2.340
.047
年份
-14.861
6.529
-.627
-2.276
.052
a.因变量:
收入
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
763.53
897.27
830.40
44.993
10
残差
-72.830
96.752
.000
55.914
10
标准预测值
-1.486
1.486
.000
1.000
10
标准残差
-1.228
1.631
.000
.943
10
a.因变量:
收入
线性回归方程为:
从“模型汇总”表中看出,修正后的R2=0.371,且Durbin-Watson统计量为1.682,这个数
值提示残差可能有自相关性。
由此,普通回归方法得到的线性回归方程拟合效果不好。
因此,需要对模型进行改进。
统计各种曲线拟合的结果如下图所示:
模型汇总和参数估计值
因变量:
收入
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
b2
b3
线性
.393
5.180
1
8
.052
912.133
-14.861
对数
.547
9.669
1
8
.014
939.796
-72.426
倒数
.606
12.280
1
8
.008
771.405
201.419
二次
.557
4.402
2
7
.058
995.633
-56.611
3.795
三次
.647
3.659
3
6
.083
1095.067
-144.803
22.917
-1.159
复合
.387
5.057
1
8
.055
911.554
.983
幂
.529
8.994
1
8
.017
940.701
-.085
S
.573
10.752
1
8
.011
6.650
.233
增长
.387
5.057
1
8
.055
6.815
-.018
指数
.387
5.057
1
8
.055
911.554
-.018
Logistic
.387
5.057
1
8
.055
.001
1.018
倒数曲线的拟合程度最好,方程为:
b.使用spss软件绘制散点图如下:
根据散点图,我认为该时间序列的趋势成分是不规则波动。
c.绘制拟合曲线如下:
由上图所示,认为数据拟合情况尚可。
d.根据a中模型分析得到:
1993年城市间长途汽车公司的总收入788.18983,预测区间为(669.26756,907.11209)。
3.两个城市间的旅馆和汽车旅馆每月的客房出租率数据,令Yt=t月凤凰城的客房出租率。
数据见文件:
客房出租率.sav
a.对E(Yt)提出一个模型,考虑月份数据可能存在的季节变差。
(提示:
考虑带虚拟变量的模型。
全年12个月除选做基础水平的月份外,其余各月每月有一个虚拟变量。
)
b.将a.中模型与数据拟合。
c.检验假设:
每个月的虚拟变量都是客房出租率的有用的预测变量。
(提示:
进行F检验。
)
d.利用B中拟合过的最小二乘模型以95%预测区间预测凤凰城第三年一月份的客房出租率。
e.对亚特兰大的客房出租率重复A—D。
第一年客房出租率
第二年客房出租率
月亚特兰大凤凰城
月亚特兰大凤凰城
15967
26385
36883
47069
56363
65952
76849
86449
96256
107369
116263
124748
16472
26991
37387
46775
56870
67161
76746
87144
96563
107273
116371
124751
解:
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011a
.
Enter
a.Allrequestedvariablesentered.
b.DependentVariable:
凤凰城
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.988a
.977
.951
3.002
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
4171.500
12
347.625
38.576
.000a
Residual
99.125
11
9.011
Total
4270.625
23
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
b.DependentVariable:
凤凰城
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
67.021
2.240
29.923
.000
VAR00001
18.146
3.004
.376
6.041
.000
VAR00002
14.792
3.009
.306
4.916
.000
VAR00003
1.438
3.017
.030
.476
.643
VAR00004
-4.417
3.030
-.092
-1.458
.173
VAR00005
-14.771
3.045
-.306
-4.851
.001
VAR00006
-24.125
3.064
-.500
-7.874
.000
VAR00007
-25.479
3.086
-.528
-8.257
.000
VAR00008
-12.833
3.111
-.266
-4.125
.002
VAR00009
-1.687
3.139
-.035
-.538
.602
VAR00010
-6.042
3.171
-.125
-1.905
.083
VAR00011
-23.896
3.205
-.495
-7.455
.000
时间编号
.354
.102
.184
3.468
.005
a.DependentVariable:
凤凰城
Y=67.021+18.146V1+14.792V2+1.438V3-4.417V4-14.771V5-24.125V6-25.479V7-12.833V8-1.687V9-6.042V10-23.896V11+0.354t
其中,Vi表示第(i+1)月与第1月的虚拟变量
将A中模型与数据拟合。
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.988a
.977
.951
3.002
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
4171.500
12
347.625
38.576
.000a
Residual
99.125
11
9.011
Total
4270.625
23
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
b.DependentVariable:
凤凰城
由上表可知,模型解释度为95.1%,且通过显著性检验,可推断拟合较好
上图预测值即为拟合值
检验假设:
每个月的虚拟变量都是客房出租率的有用的预测变量。
TestsofBetween-SubjectsEffects
DependentVariable:
凤凰城
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
Intercept
Hypothesis
151.571
1
151.571
2.410
.155
Error
573.530
9.118
62.901a
VAR00001
Hypothesis
342.250
1
342.250
19.793
.001
Error
207.500
12
17.292b
VAR00002
Hypothesis
240.250
1
240.250
13.894
.003
Error
207.500
12
17.292b
VAR00003
Hypothesis
6.250
1
6.250
.361
.559
Error
207.500
12
17.292b
VAR00004
Hypothesis
9.000
1
9.000
.520
.484
Error
207.500
12
17.292b
VAR00005
Hypothesis
169.000
1
169.000
9.773
.009
Error
207.500
12
17.292b
VAR00006
Hypothesis
484.000
1
484.000
27.990
.000
Error
207.500
12
17.292b
VAR00007
Hypothesis
529.000
1
529.000
30.593
.000
Error
207.500
12
17.292b
VAR00008
Hypothesis
100.000
1
100.000
5.783
.033
Error
207.500
12
17.292b
VAR00009
Hypothesis
2.250
1
2.250
.130
.725
Error
207.500
12
17.292b
VAR00010
Hypothesis
6.250
1
6.250
.361
.559
Error
207.500
12
17.292b
VAR00011
Hypothesis
400.000
1
400.000
23.133
.000
Error
207.500
12
17.292b
a..022MS(VAR00001)+.022MS(VAR00002)+.022MS(VAR00003)+.022MS(VAR00004)+.022MS(VAR00005)+.022MS(VAR00006)+.022MS(VAR00007)+.022MS(VAR00008)+.022MS(VAR00009)+.022MS(VAR00010)+.022MS(VAR00011)+MS(Error)
b.MS(Error)
由上表可以看出:
V1(第二月),V2(第三月),V5(第六月),V6(第七月),V7(第八月),V8(第九月),V11(第12月)为具有显著影响的预测变量(在95%置信度下)
利用B中拟合过的最小二乘模型以95%预测区间预测凤凰城第三年一月份的客房出租率。
预测区间为[66.82782464555311,84.92217535444692]
(1)模型:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
59.604
2.240
26.611
.000
VAR00001
4.229
3.004
.175
1.408
.187
VAR00002
8.458
3.009
.349
2.811
.017
VAR00003
6.188
3.017
.255
2.051
.065
VAR00004
2.917
3.030
.120
.963
.356
VAR00005
2.146
3.045
.089
.705
.496
VAR00006
4.375
3.064
.181
1.428
.181
VAR00007
4.104
3.086
.169
1.330
.210
VAR00008
-.167
3.111
-.007
-.054
.958
VAR00009
8.563
3.139
.353
2.727
.020
VAR00010
-1.708
3.171
-.071
-.539
.601
VAR00011
-17.479
3.205
-.722
-5.453
.000
时间编号
.271
.102
.280
2.652
.023
a.DependentVariable:
亚特兰大
Y=59.604+4.229V1+8.458V2+6.188V3+2.917V4+2.146V5+4.375V6+4.104V7-0.167V8+8.563V9-1.708V10-17.479V11+0.271t
(2)预测值拟合
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.953a
.908
.807
3.002
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
b.DependentVariable:
亚特兰大
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
976.833
12
81.403
9.033
.000a
Residual
99.125
11
9.011
Total
1075.958
23
a.Predictors:
(Constant),时间编号,VAR00006,VAR00005,VAR00007,VAR00004,VAR00008,VAR00003,VAR00009,VAR00002,VAR00001,VAR00010,VAR00011
b.DependentVariable:
亚特兰大
有上表可得:
模型解释度为80.7%,且通过显著性检验,可推断拟合较好
上图为拟合值
(3)假设检验:
TestsofBetween-SubjectsEffects
DependentVariable:
亚特兰大
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
Intercept
Hypothesis
574.049
1
574.049
24.895
.000
Error
288.413
12.508
23.059a
VAR00001
Hypothesis
20.250
1
20.250
1.495
.245
Error
162.500
12
13.542b
VAR00002
Hypothesis
81.000
1
81.000
5.982
.031
Error
162.500
12
13.542b
VAR00003
Hypothesis
49.000
1
49.000
3.618
.081
Error
162.500
12
13.542b
VAR00004
Hypothesis
16.000
1
16.000
1.182
.298
Error
162.500
12
13.542b
VAR00005
Hypothesis
12.250
1
12.250
.905
.360
Error
162.500
12
13.542b
VAR00006
Hypothesis
36.000
1
36.000
2.658
.129
Error
162.500
12
13.542b
VAR00007
Hypothesis
36.000
1
36.000
2.658
.129
Error
162.500
12
13.542b
VAR00008
Hypothesis
4.000
1
4.000
.295
.597
Error
162.500
12
13.542b
VAR00009
Hypothesis
121.000
1
121.000
8.935
.011
E