1、回归分析应用实例讲解-影响成品钢材量的多元回归分析故当原油产量为 16225.86 万吨,生铁产量为 12044.54 万吨,原煤产量为 13.87 万吨以及发电量为 12334.89 亿千瓦时时,成品钢材量预测值为 10727.33875 万吨;当原油产量为 17453 万吨,生铁产量为 12445.96 万吨,原煤产量为 14.54 万吨以及发电量为 13457 亿千瓦时时,成品钢材量预测值为 10727.33875万吨。钢材的需求量设为 y,作为被解释变量, 而原油产量 x1 、生铁产量x2 、原煤产量 x3 、发电量 x4 作为解释变量,通过建立这些经济变量的线性模型来研究影响成品钢材
2、需求量的原因。能源转换技术等因素。在此,收集的数据选择与其相关的四个因素:原油产量、生铁产量、原煤产量、发电量, 19801997 的有关数据如下表。理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、原始数据(中国统计年鉴)年份yx1x2x3x419802716.2010595.003802.406.203006.2019812670.1010122.003416.606.203092.7019822902.0010212.003551.006.663277.0019833072.0010607.003738.007.153514.0019843372.
3、0011461.304001.007.893770.0019853693.0012489.504384.008.724107.0019864058.0013068.805064.008.944495.0019874356.0013414.005503.009.284973.00198813704.605704.004689.009.805452.004859.0013764.105820.005848.00198910.54-19906238.005153.0013830.6010.806212.00199114009.206765.0010.876775.005638.0019926697.
4、0014209.707589.0011.167539.0019937716.0014523.008739.0011.518395.0019948482.0014608.209741.0012.409281.0019958979.8015004.9410529.2713.6110070.3019969338.0215733.3910722.5013.9710813.1019979978.9316074.1411511.4113.7311355.53将中国成品一、 模型的设定设因变量 y 与自变量 x1 、 x2 、 x3 、 x4 的一般线性回归模型为 :y = 0 + 1x1 2 x23 x3
5、4 x4是随机变量,通常满足( )0 ; Var( )= 2二 参数估计系数 a非标准化系数标准系数模型B标准 误差试用版tSig.1(常量 )170.287494.572.344.736原油(万吨 )-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.073a.因变量 : 成品钢材(万吨)再用 spss做回归线性,根据系数表得出回归方程为:-y 1 7 0 . 2 8 7 0x. 0 4 1x 0 . 5 5 4x1 7 .
6、 8 1x 80.3891234再做回归预测,得出如下截图:故当原油产量为 16225.86 万吨,生铁产量为 12044.54 万吨,原煤产量为 13.87 万吨以及发电量为 12334.89 亿千瓦时时,成品钢材量预测值为 10727.33875 万吨;当原油产量为 17453 万吨,生铁产量为12445.96 万吨,原煤产量为 14.54 万吨以及发电量为 13457 亿千瓦时时,成品钢材量预测值为 10727.33875万吨。三 回归方程检验描述性统计量均值 标准 偏差 N-成品钢材(万吨)原油(万吨 )生铁(万吨)原煤(万吨)发电量(亿千瓦时)Pearson 相关性 成品钢材(万吨)
7、原油(万吨 )生铁(万吨)原煤(万吨)发电量(亿千瓦时)Sig. (单侧) 成品钢材(万吨)原油(万吨 )生铁(万吨)原煤(万吨)发电量(亿千瓦时)N 成品钢材(万吨)原油(万吨 )生铁(万吨)原煤(万吨)发电量(亿千瓦时)5465.00282460.349261813190.63721875.78873186489.95442700.79676189.96832.54018186220.87942768.1119118相关性发电量(亿千瓦成品钢材(万吨)原油(万吨 )生铁(万吨)原煤(万吨)时)1.000.909.998.961.997.9091.000.912.973.920.998.91
8、21.000.962.997.961.973.9621.000.971.997.920.997.9711.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.000.18181818181818181818181818181818181818181818181818由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9 以上,说明变量间的线性相关程度很高,适合做多元线性回归模型 。模型汇总 b模型RR 方调整 R方标准 估计的误差1a.997.997140.71641.999a
9、. 预测变量 : (常量 ), 发电量(亿千瓦时), 原油(万吨 ), 原煤(万吨) , 生铁(万吨) 。-模型汇总 b模型 R R方 调整 R方 标准 估计的误差1 .999a .997 .997 140.71641a. 预测变量 : (常量 ), 发电量(亿千瓦时) , 原油(万吨 ), 原煤(万吨) , 生铁(万吨) 。b.因变量 : 成品钢材(万吨)由 R2 =0.997 以及调整之后的 R2 =0.997 知,模型对样本观测数据的拟合度很好。Anovab模型平方和df均方FSig.1回归1.026E842.566E71296.001.000a残差257414.4041319801.1
10、08总计1.029E817a. 预测变量 : (常量 ), 发电量(亿千瓦时), 原油(万吨 ), 原煤(万吨) , 生铁(万吨) 。b.因变量 : 成品钢材(万吨)由 F=1296.001 P 值 =0.000 =0.05,故拒绝原假设,认为自变量联合起来对因变量有显著影响,通过 F 检验。系数 a非标准化系数标准系数模型B标准 误差试用版tSig.1(常量 )170.287494.572.344.736原油(万吨 )-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(
11、亿千瓦时).389.199.4381.952.073a.因变量 : 成品钢材(万吨)因为 t3 =-0.154 P 值=0.880 远远大于 =0.05,故接受原假设,认为 x3 对因变量y 没有显著影响, 故应剔除 x3 。用后退法剔除变量后, 再做回归线性,得如下表:-系数 a非标准化系数标准系数模型B标准 误差试用版tSig.1(常量 )170.287494.572.344.736原油(万吨 )-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.
12、199.4381.952.0732(常量 )197.734445.099.444.664原油(万吨 )-.053.045-.041-1.172.261生铁(万吨).564.150.6203.760.002发电量(亿千瓦时).371.153.4172.417.0303(常量 )-309.403105.079-2.944.010生铁(万吨).591.150.6493.937.001发电量(亿千瓦时).311.147.3502.125.051a.因变量 : 成品钢材(万吨)Anovad模型平方和df均方FSig.1回归1.026E842.566E71296.001.000a残差257414.4041
13、319801.108总计1.029E8172回归1.026E833.422E71857.513.000b残差257885.8841418420.420总计1.029E8173回归1.026E825.131E72718.023.000c残差283174.3241518878.288总计1.029E817a. 预测变量 : (常量 ), 发电量(亿千瓦时), 原油(万吨 ), 原煤(万吨) , 生铁(万吨) 。b.预测变量 : (常量 ), 发电量(亿千瓦时) , 原油(万吨 ), 生铁(万吨)。c.预测变量 : (常量 ), 发电量(亿千瓦时) , 生铁(万吨)。d.因变量 : 成品钢材(万吨)
14、-最后剔除 x1 、 x3 两个自变量,得出新的回归方程为:y 309.403 0.591x2 0.311x4F=2718.023 P 值=0.000 故拒绝原假设,通过 F 检验。四 基本假定检验1、异方差检验等级相关系数检验做 abs(e)与 x 的等级相关系数,得出表如下相关系数发电量(亿千瓦原油(万吨 )生铁(万吨)原煤(万吨)时)abseSpearman 的 rho原油(万吨 )相关系数1.000.998*.994*.994*.263Sig.(双侧).000.000.000.291N1818181818生铁(万吨)相关系数.998*1.000.989*.988*.294Sig.(双侧
15、).000.000.000.236N1818181818原煤(万吨)相关系数.994*.989*1.000.997*.227Sig.(双侧).000.000.000.365N1818181818发电量(亿千瓦时)相关系数.994*.988*.997*1.000.212Sig.(双侧).000.000.000.399N1818181818abse相关系数.263.294.227.2121.000Sig.(双侧).291.236.365.399.N1818181818*. 在置信度(双测)为0.01 时,相关性是显著的。由表中 P 值全大于 0.01,故接受原假设,模型中不存在异方差。-2、自相关
16、检验模型汇总 b模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson1 .999a .997 .997 140.71641 .922a. 预测变量 : (常量 ), 发电量(亿千瓦时) , 原油(万吨 ), 原煤(万吨) , 生铁(万吨)。b.因变量 : 成品钢材(万吨)DW=0.992 n=18 k=5,查表得出 dl 0.82, du 1.87 ,故 DW 落入无法确定的领域。自相关性不明显,由此也看出 DW 检验的局限性。3、多重共线性系数 a非标准化系数标准系数共线性统计量模型B标准误差试用版tSig.容差VIF1(常量 )170.287494.572.344.
17、736原油(万吨 )-.041.090-.031-.457.655.04124.672生铁(万吨).554.170.6083.267.006.006180.105原煤(万吨)-17.818115.468-.018-.154.880.01473.861发电量(亿千瓦时).389.199.4381.952.073.004261.480a.因变量 : 成品钢材(万吨)共线性诊断 a方差比例发电量(亿千瓦模型维数特征值条件索引(常量 )原油(万吨 )生铁(万吨)原煤(万吨)时)114.8781.000.00.00.00.00.002.1186.435.02.00.00.00.003.00437.106
18、.36.03.03.09.004.00188.718.57.46.28.21.165.000137.100.05.51.68.70.84-a. 因变量 : 成品钢材(万吨)因为 VIF 中有两个远远的大于 10,故模型存在严重的多重共线性。由共线性诊断表中数据得出, x2 、 x3 、 x4 之间存在多重共线性。故先剔除变量 x4 ,再做线性回归,得出表如下:系数 a非标准化系数标准系数共线性统计量模型B标准误差试用版tSig.容差VIF1(常量 )59.520538.378.111.914原油(万吨 )-.108.092-.082-1.178.258.04721.142生铁(万吨).871.
19、054.95616.144.000.06615.176原煤(万吨)118.233100.887.1221.172.261.02146.956a.因变量 : 成品钢材(万吨)共线性诊断 a方差比例模型维数特征值条件索引(常量 )原油(万吨 )生铁(万吨)原煤(万吨)113.9171.000.00.00.00.002.0797.042.02.00.06.003.00333.686.33.04.66.134.00187.743.64.96.28.87a.因变量 : 成品钢材(万吨)由于模型中仍然存在多重共线性,故继续剔除 VIF 最大的变量 x3 ,再做线性回归,得出表如下系数 a非标准化系数 标准
20、系数 共线性统计量模型 B 标准 误差 试用版 t Sig. 容差 VIF-1(常量 )-282.131458.218-.616.547原油(万吨 )-.017.049-.013-.345.735.1685.967生铁(万吨).920.0341.01026.871.000.1685.967a.因变量 : 成品钢材(万吨)共线性诊断 a方差比例模型维数特征值条件索引(常量 )原油(万吨 )生铁(万吨)112.9221.000.00.00.002.0766.204.03.00.193.00238.315.971.00.81a.因变量 : 成品钢材(万吨)系数 a非标准化系数标准系数共线性统计量模型
21、B标准误差试用版tSig.容差VIF1(常量 )-282.131458.218-.616.547原油(万吨 )-.017.049-.013-.345.735.1685.967生铁(万吨).920.0341.01026.871.000.1685.967a.因变量 : 成品钢材(万吨)由于剔除变量 x3 后,VIF 值都小于 10,故多重共线性得以消除, 得出新的回归方程:y282.1310.017x10.92x24、异常值和强影响值残差统计量 a极小值 极大值 均值 标准 偏差 N预测值 2738.5310 10059.5371 5465.0028 2457.27013 18-标准 预测值-1.1101.870.0001.00018预测值的标准误差53.220117.71772.28817.05718调整的预测值2770.477510140.25595485.89002473.4477418残差-182.88765241.19569.00000123.0529318标准 残差-1.3001.714.000.87418Student 化 残差-1.7101.887-.0571.0221
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1