【原创】r语言股票价格回归分析报告论文Word格式.docx

资源描述

【原创】r语言股票价格回归分析报告论文Word格式.docx

《【原创】r语言股票价格回归分析报告论文Word格式.docx》由会员分享，可在线阅读，更多相关《【原创】r语言股票价格回归分析报告论文Word格式.docx（19页珍藏版）》请在冰豆网上搜索。

【原创】r语言股票价格回归分析报告论文Word格式.docx

4.分析得出结论得出各个自变量之间的关系，以及它们对因变量的影响极其经济意义。

二、获取数据及预处理

获取2012年1月到2015年7月的上证指数数据,货币供应量,消费价格指数人民币美元汇率和存款利率数据

绘制变量之间的散点图

plot（data）

par（mfrow=c（2,2））

plot（美元汇率,上证指数数据）

plot（人民币存款利率,上证指数数据）

三、指数平滑时间序列模型预测

表示时间序列

## Jan Feb Mar Apr May Jun

Jul

2012

263.670

19.925

240.655

131.620

245.665

368.020

2013

-51.615

-156.545

69.235

-46.705

-329.040

-181.635

-2.555

2014

-65.535

87.565

79.200

37.740

-157.900

-118.655

59.360

2015

-50.230

142.300

-11.580

-25.710

47.830

-92.995

-115.865

Aug

Sep

Oct

Nov

Dec

-130.350

-216.610

125.145

163.415

44.480

145.310

5.895

236.405

97.135

-142.555

-176.755

-108.775

-71.055

32.655

-149.320

利用HoltWinters函数预测：

p.hw<

-forecast.HoltWinters（m.hw,h=24）#h=24表示预测24个值

四、进行多元回归模型并进行分析

summary（lmmod）#显示回归结果

##Call:

##lm（formula=y~x1+x2+x3+x4,data=data）##

##Residuals:

##Min1QMedian3QMax##-543.94-90.091.69113.01500.68##

##Coefficients:

## EstimateStd.ErrortvaluePr（>

|t|）

##（Intercept）-3.457e+04 9.319e+03 -3.7100.000661***##x1 3.325e-03 1.369e-03 2.4300.019950*

##x2 1.341e+01 2.663e+01 0.5030.617562

##x3 4.787e+01 1.400e+01 3.4200.001511**##x4 7.870e+02 3.380e+02 2.3280.025322*##---

##Signif.codes:

***'

0.001'

**'

0.01'

0.05'

0.1'

1##

##Residualstandarderror:

246.5on38degreesoffreedom

##MultipleR-squared:

0.4804,AdjustedR-squared:

0.4257##F-statistic:

8.783on4and38DF, p-value:

4.012e-05

回归结果分析

从输出结果可以看出，回归方程为，变量和的统计量的估计值分别为-3.457e+04，3.325e-03，1.341e+01，4.787e+01和7.870e+02，除了x2以外由对

应的值都比显著性水平0.05小，可得两个偏回归系p数在显著性水平0.05下均显著不为零。

进一步地剩余方差的估计值，f统计量的估计值为8.783，由对应的p值4.012e-05说明，回归方程是显著的。

可决系数R，修正的可决系数R为0.48左右说明方程的拟合效果较好。

拟合效果图形展示

以上证指数的原始数据作为x轴，回归拟合值为轴作图，在xy面上的点用直线连接见图1。

货币供应量数据"

居民消费价格指数"

美元汇率"

人民币存款利率"

之间原始图和拟合值的关系散点图

plot（货币供应量数据,上证指数数据,type="

）

plot（人民币存款利率,上证指数数据,type="

lines（人民币存款利率,fitted（lmmod）,col="

red"

置信区间与预测区间：

置信区间是给定自变量值后，由回归方程得到的的预测值（实0y际上是的平均值）的置信区间；

预测区间是实际值的置信区间，在这里称为预测区间。

0y0y预测区间要比置信区间稍大，命令与显示结果如下

predict（lmmod,int="

fit

lwr

upr

2475.2422251.506

2698.979

2499.7752292.238

2707.313

2577.0192407.631

2746.407

2591.8862430.249

2753.522

2587.0352430.370

2743.701

2693.3362533.406

2853.266

2700.1742534.939

2865.409

2721.1342574.972

2867.296

##9

。

2739.653

2604.015

2875.291

##38

2292.462

2133.936

2450.987

##39

2431.019

2261.307

2600.730

##40

2353.466

2189.958

2516.974

##41

2428.789

2234.366

2623.211

##42

2359.794

2122.260

2597.327

##43

2165.294

1879.112

2451.475

2475.242

1928.352

3022.133

2499.775

1959.309

3040.241

2577.019

2050.024

3104.014

2591.886

2067.331

3116.441

2587.035

2063.991

3110.080

1903.920

2958.118

1828.331

2878.601

1893.222

2964.355

1807.115

2912.473

1590.027

2740.560

残差分析：

残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验，同时还可以找出离群点。

命令语句为plot（lm.1），显示结果如下

par（mfrow=c（2,2））plot（lmmod）

左上图是拟合值与残差的散点图，从图上可以发现，除去第6个离群点外，所有点基本上是随机地分散在纵坐标值为-1和+1的两条平行线之间，这说明随机误差项具有同方差性；

左下图是拟合值与残差的标准差的散点图，其意义与上面类似；

右上图表明随机误差项是服从正态分布的，其原因是正态Q-Q图近似地可以看成一条直线；

右下图的CooK距离图进一步证实第6个观测值是一个离群点，它对回归方程的影响是比较大的，要根据具体问题，讨论出现这一观测值的实际背景。

逐步回归优化

使用逐步回归法建立“最优”的回归方程

##Start:

AIC=478.32

##y~x1+x2+x3+x4##

-x2

Sum

ofSq

15401

RSS

2324529

AIC

476.61

none>

2309128

478.32

-x4

329390

展开阅读全文