【原创】r语言股票价格回归分析报告论文Word格式.docx
《【原创】r语言股票价格回归分析报告论文Word格式.docx》由会员分享,可在线阅读,更多相关《【原创】r语言股票价格回归分析报告论文Word格式.docx(19页珍藏版)》请在冰豆网上搜索。
![【原创】r语言股票价格回归分析报告论文Word格式.docx](https://file1.bdocx.com/fileroot1/2022-10/1/3d6f9545-71a1-43da-a24c-dda19a6c1175/3d6f9545-71a1-43da-a24c-dda19a6c11751.gif)
4.分析得出结论得出各个自变量之间的关系,以及它们对因变量的影响极其经济意义。
二、获取数据及预处理
获取2012年1月到2015年7月的上证指数数据,货币供应量,消费价格指数人民币美元汇率和存款利率数据
绘制变量之间的散点图
plot(data)
par(mfrow=c(2,2))
plot(美元汇率,上证指数数据)
plot(人民币存款利率,上证指数数据)
三、指数平滑时间序列模型预测
表示时间序列
## Jan Feb Mar Apr May Jun
Jul
##
2012
263.670
19.925
240.655
131.620
245.665
368.020
2013
-51.615
-156.545
69.235
-46.705
-329.040
-181.635
-2.555
2014
-65.535
87.565
79.200
37.740
-157.900
-118.655
59.360
2015
-50.230
142.300
-11.580
-25.710
47.830
-92.995
-115.865
Aug
Sep
Oct
Nov
Dec
-130.350
-216.610
125.145
163.415
44.480
145.310
5.895
236.405
97.135
-142.555
-176.755
-108.775
-71.055
32.655
-149.320
利用HoltWinters函数预测:
p.hw<
-forecast.HoltWinters(m.hw,h=24)#h=24表示预测24个值
四、进行多元回归模型并进行分析
summary(lmmod)#显示回归结果
##Call:
##lm(formula=y~x1+x2+x3+x4,data=data)##
##Residuals:
##Min1QMedian3QMax##-543.94-90.091.69113.01500.68##
##Coefficients:
## EstimateStd.ErrortvaluePr(>
|t|)
##(Intercept)-3.457e+04 9.319e+03 -3.7100.000661***##x1 3.325e-03 1.369e-03 2.4300.019950*
##x2 1.341e+01 2.663e+01 0.5030.617562
##x3 4.787e+01 1.400e+01 3.4200.001511**##x4 7.870e+02 3.380e+02 2.3280.025322*##---
##Signif.codes:
0'
***'
0.001'
**'
0.01'
*'
0.05'
.'
0.1'
'
1##
##Residualstandarderror:
246.5on38degreesoffreedom
##MultipleR-squared:
0.4804,AdjustedR-squared:
0.4257##F-statistic:
8.783on4and38DF, p-value:
4.012e-05
回归结果分析
从输出结果可以看出,回归方程为,变量和的统计量的估计值分别为-3.457e+04,3.325e-03,1.341e+01,4.787e+01和7.870e+02,除了x2以外由对
应的值都比显著性水平0.05小,可得两个偏回归系p数在显著性水平0.05下均显著不为零。
进一步地剩余方差的估计值,f统计量的估计值为8.783,由对应的p值4.012e-05说明,回归方程是显著的。
可决系数R,修正的可决系数R为0.48左右说明方程的拟合效果较好。
拟合效果图形展示
以上证指数的原始数据作为x轴,回归拟合值为轴作图,在xy面上的点用直线连接见图1。
"
货币供应量数据"
"
居民消费价格指数"
美元汇率"
人民币存款利率"
之间原始图和拟合值的关系散点图
plot(货币供应量数据,上证指数数据,type="
l"
)
plot(人民币存款利率,上证指数数据,type="
lines(人民币存款利率,fitted(lmmod),col="
red"
置信区间与预测区间:
置信区间是给定自变量值后,由回归方程得到的的预测值(实0y际上是的平均值)的置信区间;
预测区间是实际值的置信区间,在这里称为预测区间。
0y0y预测区间要比置信区间稍大,命令与显示结果如下
predict(lmmod,int="
c"
fit
lwr
upr
1
2475.2422251.506
2698.979
2
2499.7752292.238
2707.313
3
2577.0192407.631
2746.407
4
2591.8862430.249
2753.522
5
2587.0352430.370
2743.701
6
2693.3362533.406
2853.266
7
2700.1742534.939
2865.409
8
2721.1342574.972
2867.296
##9
。
2739.653
2604.015
2875.291
##38
2292.462
2133.936
2450.987
##39
2431.019
2261.307
2600.730
##40
2353.466
2189.958
2516.974
##41
2428.789
2234.366
2623.211
##42
2359.794
2122.260
2597.327
##43
2165.294
1879.112
2451.475
p"
2475.242
1928.352
3022.133
2499.775
1959.309
3040.241
2577.019
2050.024
3104.014
2591.886
2067.331
3116.441
2587.035
2063.991
3110.080
39
1903.920
2958.118
40
1828.331
2878.601
41
1893.222
2964.355
42
1807.115
2912.473
43
1590.027
2740.560
残差分析:
残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。
命令语句为plot(lm.1),显示结果如下
par(mfrow=c(2,2))plot(lmmod)
左上图是拟合值与残差的散点图,从图上可以发现,除去第6个离群点外,所有点基本上是随机地分散在纵坐标值为-1和+1的两条平行线之间,这说明随机误差项具有同方差性;
左下图是拟合值与残差的标准差的散点图,其意义与上面类似;
右上图表明随机误差项是服从正态分布的,其原因是正态Q-Q图近似地可以看成一条直线;
右下图的CooK距离图进一步证实第6个观测值是一个离群点,它对回归方程的影响是比较大的,要根据具体问题,讨论出现这一观测值的实际背景。
逐步回归优化
使用逐步回归法建立“最优”的回归方程
##Start:
AIC=478.32
##y~x1+x2+x3+x4##
-x2
Df
Sum
ofSq
15401
RSS
2324529
AIC
476.61
<
none>
2309128
478.32
-x4
329390