回归分析作业.docx
《回归分析作业.docx》由会员分享,可在线阅读,更多相关《回归分析作业.docx(29页珍藏版)》请在冰豆网上搜索。
回归分析作业
回归分析作业
公管112111401025烨烽
1
数据文件“资产评估1”提供了35家上市公司资产评估增值的数据。
pg----资产评估增值率
gz----固定资产在总资产中所占比例
fz----权益与负债比
bc----总资产投资报酬率
gm---公司资产规模(亿元)
a.建立关于资产评估增值率的四元线性回归方程,并通过统计分析、检验说明所得方程的有效性,解释各回归系数的经济含义。
解:
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.871a
.759
.727
.0787500
a.Predictors:
(Constant),公司规模,权益与负债比,固定资产比重,总资产投资报酬率
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
.586
4
.146
23.609
.000a
Residual
.186
30
.006
Total
.772
34
a.Predictors:
(Constant),公司规模,权益与负债比,固定资产比重,总资产投资报酬率
b.DependentVariable:
资产评估增值率
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.396
.145
2.736
.010
固定资产比重
.079
.082
.092
.972
.339
权益与负债比
.062
.016
.416
3.918
.000
总资产投资报酬率
.602
.130
.493
4.618
.000
公司规模
-.044
.014
-.304
-3.201
.003
a.DependentVariable:
资产评估增值率
由ModleSummary和ANOVA表可知,R为0.871,决定系数R2为0.759,校正决定系数为0.727。
拟合的回归方程模型F值为23.609,P值为0,所以拟合的模型是有意义的。
因为gz的sig=0.339>0.05,说明gz对pg的影响不显著
回归方程为pg=0.396+0.079gz+0.063fz+0.602bc-0.044gm
0.079表示,其他变量不变,gz每增加一个单位,pg增加0.079
0.063表示,其他变量不变,fz每增加一个单位,pg增加0.063
0.602表示,其他变量不变,bc每增加一个单位,pg增加0.602
-0.044表示,其他变量不变,gm每增加一个单位,pg增加-0.044
b.剔除gz变量,建立关于资产评估增值率的三元线性回归方程,与a中的模型相比较,那个更为实用有效,说明理由。
解:
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.867a
.751
.727
.0786809
a.Predictors:
(Constant),公司规模,权益与负债比,总资产投资报酬率
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
.580
3
.193
31.218
.000a
Residual
.192
31
.006
Total
.772
34
a.Predictors:
(Constant),公司规模,权益与负债比,总资产投资报酬率
b.DependentVariable:
资产评估增值率
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.376
.143
2.628
.013
权益与负债比
.063
.016
.422
3.981
.000
总资产投资报酬率
.600
.130
.491
4.607
.000
公司规模
-.040
.013
-.275
-3.052
.005
a.DependentVariable:
资产评估增值率
相关系数R为0.867,决定系数R2为0.751,校正决定系数为0.727
回归方程为pg=0.376+0.063fz+0.600bc-0.040gm
B更为有效实用,因为所有回归系数都通过了t检验,所以误差较小
2
数据文件“房产销售”提供了20件房地产的销售价格和评估的数据(美元):
y----销售价格;x1----地产评估价值;x2----房产评估价值;x3----面积(平方英尺)。
a.建立适当的关于销售价格的多元线性回归模型.
解:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
1475.648
5742.859
.257
.800
地产价值
.814
.512
.193
1.589
.132
房产价值
.821
.211
.557
3.890
.001
面积
13.509
6.583
.277
2.052
.057
a.DependentVariable:
销售价格
因为地产评估价值的sig=0.132>0.05,所以地产评估价值影响不显著,剔除地产评估价值,所的数据如下:
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.939a
.881
.867
8262.430
a.Predictors:
(Constant),面积,房产价值
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
8.623E9
2
4.311E9
63.153
.000a
Residual
1.161E9
17
6.827E7
Total
9.783E9
19
a.Predictors:
(Constant),面积,房产价值
b.DependentVariable:
销售价格
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
105.382
5927.158
.018
.986
房产价值
.961
.200
.651
4.797
.000
面积
16.348
6.615
.336
2.472
.024
a.DependentVariable:
销售价格
回归方程为:
y=105.382+0.961x2+16.348x3
b.利用模型预测地产评估价值为2000,房产评估价值为12000,面积为1100的销售价格,并给出预测值的95%的置信区间。
解:
置信区间为(21468.99197,37776.93332)
c.通过对模型的统计检验说明预测值的可信度。
解:
模型AdjustedRSquare=0.867,可解释86.7%因变量变差,且残差符合正态性,独立性和方差齐次性,模型成立,可信度高。
3
大多数公司都提供了β估计值,以反映证券的系统风险。
一种股票的β值所测量的是这种股票的回报率与整个市场平均回报率之间的关系。
这个指标的名称就来自简单线性回归中的斜率参数β。
在这种回归中,因变量是股票回报率(Y)。
而自变量则是市场回报率(X)。
值大于1的股票被称为“攻击性”证券,因为它们的回报率变动(向上或向下)得比整个市场的回报率快。
相反,β值小于1的股票被称为“防御性”证券,因为它们的回报率变动的比市场回报率慢。
值接近1的股票被称为“中性”证券,因为它们的回报率反映市场回报率。
下面表中的数据是随机抽选的7个月某只特定的股票的月回报率及整个市场的回报率。
试对这些数据完成简单线性回归分析。
根据你的分析结果,你认为这只股票是属于攻击性,防御性,还是中性的股票?
月股票回报率Y市场回报率X
112.07.2
2–1.30.0
32.52.1
418.611.9
59.05.3
6–3.8–1.2
7–10.0–4.7
解:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
-1.329
.323
-4.109
.009
股票回报率X
1.762
.054
.998
32.539
.000
a.DependentVariable:
股票回报率Y
回归方程y=1.762x-1.329.
斜率β=1.762>1,所以,该股票属于“攻击性股票”。
4
参考上题。
股票的β值是否依赖于计算回报率的时间长度?
因为有些经济商号用的是按月数据计算的β值,另一些经济商号则用按年数据计算的β值,所以这个问题对投资者来说很重要。
H.莱维分别研究了三类股票的时间长度(月)和平均β值。
将时间长度从一个月逐步增加到30个月,莱维计算了1946---1975年间144只股票的回报率。
根据他所得的β值,这144只股票中有38只攻击性股票,38只防御性股票,以及68只中性股票。
下表中给出的这三类股票对不同时间水平的平均β值。
A、对于攻击性股票、防御性股票和中性股票三种情况,分别求表达平均β值Y与时间长度X之间关系的最小二乘简单线性回归方程。
B、对每一类股票检验假设:
时间长度是平均β值的有效线性预测器,检验时用α=0.05。
C、对每一类股票,构造直线斜率的95%置信区间,哪只股票的β值随时间长度的增大而线性增大?
时间长度X,月
β值,Y
攻击性股票防御性股票中性股票
1
3
6
9
12
15
18
24
30
1.370.500.98
1.420.440.95
1.530.410.94
1.690.391.00
1.830.400.98
1.670.381.00
1.780.391.02
1.860.351.14
1.830.331.22
解
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
1.451
.059
24.392
.000
时间长度X
.016
.004
.856
4.377
.003
a.DependentVariable:
攻击性股票
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.459
.013
34.178
.000
时间长度X
-.005
.001
-.901
-5.488
.001
a.DependentVariable:
防御性股票
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.911
.025
37.083
.000
时间长度X
.009
.002
.906
5.672
.001
a.DependentVariable:
中性股票
A
攻击性股票y=0.016x+1.451
防御性股票y=-0.05x+0.459
中性股票y=0.009x+0.911
B
攻击性股票的sig=0.003<0.05
防御性股票的sig=0.001<0.05
中性股票的sig=0.001<0.05
时间长度的影响都显著,所以假设检验有效
C
R1=0.016>0,R2=-0.05<0,R3=0.009>0
所以攻击性和中性的股票β值随时间长度的增大而线性增大
5
个人计算机(PC机)正以非凡的技术在发展,PC机的零售价格也是这样。
由于购买时间和机器特点不同,一台PC机的零售价格可能发生戏剧性的变化。
不久前收集了一批IBMPC机和IBMPC兼容机的零售价格数据,共有N=60,见数据文件“计算机价格”。
这些数据被用来拟合多元回归
E(y)=β0+β1x1+β2x2
其中:
Y=零售价格(美元)
X=微处理器速度(兆赫)
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.610a
.373
.350
962.967
a.Predictors:
(Constant),芯片,速度
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
3.083E7
2
1.541E7
16.622
.000a
Residual
5.193E7
56
927305.918
Total
8.276E7
58
a.Predictors:
(Constant),芯片,速度
b.DependentVariable:
价格y
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
95.0%ConfidenceIntervalforB
B
Std.Error
Beta
LowerBound
UpperBound
1
(Constant)
-68.509
1461.468
-.047
.963
-2996.181
2859.162
速度
108.237
21.198
.582
5.106
.000
65.772
150.702
芯片
2.486
4.174
.068
.596
.554
-5.876
10.848
a.DependentVariable:
价格y
a、试写出最小二乘预测方程。
解:
价格y=-68.509+108.237*x1+2.486*x2
b、此模型是否适合于预测?
用α=0.10进行检验。
解:
速度的sig=.000<0.10,影响显著
芯片sig=.554>0.10,影响不显著
所以对a=0.10,此模型不适合预测
c、构造β1的90%置信区间,并对此区间作出解释。
解:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
90.0%ConfidenceIntervalforB
B
Std.Error
Beta
LowerBound
UpperBound
1
(Constant)
-68.509
1461.468
-.047
.963
-2512.847
2375.828
速度
108.237
21.198
.582
5.106
.000
72.783
143.691
芯片
2.486
4.174
.068
.596
.554
-4.495
9.467
a.DependentVariable:
价格y
置信区间为(-2.51,2375.828)
d、本模型中的CPU芯片(x2)是否是价格(Y)的有效预测器?
用α=0.10进行预测。
解:
芯片sig=.554>0.10,影响不显著
PU芯片(x2)不是价格(Y)的有效预测器
6、
在工厂中,准确完成估计完成一项作业所需的工时数对于诸如决定雇佣工人的数量,确定向客户报价的最后期限,或者作出与预算有关的成本分析决策等决策管理来说是极端重要的。
一名锅炉筒制造商想预测在一些在未来预测项目中装配锅炉筒所需的工时数。
为了用回归方法实现此目标,他收集了35个锅炉的项目数据(数据文件“锅炉”)。
除工时(Y)外,被测量的变量有锅炉工作容量(X1=磅/小时),锅炉设计压力(X2=磅/平方英寸),锅炉的类型(X3=1,如在生产领域装配;X3=0,如在使用领域装配),以及炉筒类型(X4=1,蒸汽炉筒;X4=0,液体炉筒)。
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.950a
.903
.890
906.372
a.Predictors:
(Constant),筒类型x4,炉类型x3,容量x1,压力x2
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2.297E8
4
5.741E7
69.887
.000a
Residual
2.465E7
30
821510.675
Total
2.543E8
34
a.Predictors:
(Constant),筒类型x4,炉类型x3,容量x1,压力x2
b.DependentVariable:
工时y
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
95.0%ConfidenceIntervalforB
B
Std.Error
Beta
LowerBound
UpperBound
1
(Constant)
-3727.268
1227.784
-3.036
.005
-6234.737
-1219.800
容量x1
.009
.001
.903
9.491
.000
.007
.011
压力x2
1.898
.661
.388
2.873
.007
.549
3.247
炉类型x3
3410.104
926.871
.531
3.679
.001
1517.180
5303.027
筒类型x4
2118.726
314.805
.392
6.730
.000
1475.809
2761.644
a.DependentVariable:
工时y
A、试检验假设:
锅炉容量(X1)与工时数(Y)之间有正线性关系。
用
解:
容量的sig=.000<0.05,影响显著,所以有线性关系
B、试检验假设:
锅炉压力(X3)与工时数(Y)之间有正线性关系。
用
解:
锅炉压力的sig=.001<0.05,影响显著,所以有线性关系
C、构造β1的95%置信区间并对结果做出解释。
解;
T(α/2)=2.03
0.009±2.03*0.001=[0.00697——0.01103]
解释:
抽出的样品计算β1,有95%的计算结果落入此区间
D、构造β3的95%置信区间。
解:
T(α/2)=2.03
3410.104±2.03*926.871=[1528.556——5291.652]
7
Cushman&Wakefield股份,采集了美国市场上办公用房的空闲率和租金率的数据。
对于18个选取的销售地区,这些地区的中心商业区的综合空闲率(%)和平均租金率(美元/平方英尺)的数据(TheWallJournalAlmanac1988)见文件“办公用房”。
a.用水平轴表示空闲率,对这些数据画出散点图。
Correlations
综合空闲
平均租金
综合空闲
PearsonCorrelation
1
-.659**
Sig.(2-tailed)
.003
N
18
18
平均租金
PearsonCorrelation
-.659**
1
Sig.(2-tailed)
.003
N
18
18
**.Correlationissignificantatthe0.01level(2-tailed).
b.这两个变量之间显出什么关系吗?
解:
有,线性相关。
c.求出在办公用房的综合空闲率已知时,能用来预测平均租金率的估计的回归方程。
解:
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
37.075
3.528
10.510
.000
综合空闲
-.779
.222
-.659
-3.504
.003
a.DependentVariable:
平均租金
回归方程y=-0.779+37.075
d.在0.05显著水平下检验关系的显著性。
解:
g=0.003<0.05,所以线性