1、多元线性回归模型的案例讲解1. 表1列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(元/千克)年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(元/千克)19802.783974.225.077.8319924.189113.977.9111.4019812.994133.815.207.9219934.049315.219.5412.4119822.984394.035.407.9219944.0710214.899.4212.7619833.084593.95
2、5.537.9219954.0111655.8312.3514.2919843.124923.735.477.7419964.2713495.7912.9914.3619853.335283.816.378.0219974.4114495.6711.7613.9219863.565603.936.988.0419984.6715756.3713.0916.5519873.646243.786.598.3919995.0617596.1612.9820.3319883.676663.846.458.5520005.0119945.8912.8021.9619893.847174.017.009.
3、3720015.1722586.6414.1022.1619904.047683.867.3210.6120025.2924787.0416.8223.2619914.038433.986.7810.48(1)求出该地区关于家庭鸡肉消费需求的如下模型:(2)请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。先做回归分析,过程如下:输出结果如下:所以,回归方程为: (-2.463) (4.182) (-4.569) (1.483) (0.873)由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。验证猪肉价格和鸡肉价格是否有影
4、响,可以通过赤池准则(AIC)和施瓦茨准则(SC)。若AIC值或SC值增加了,就应该去掉该解释变量。去掉猪肉价格P2与牛肉价格P3重新进行回归分析,结果如下:VariableCoefficientStd. Errort-StatisticProb.C-1.1257970.088420-12.732370.0000LOG(X)0.4515470.02455418.389660.0000LOG(P1)-0.3727350.063104-5.9066680.0000R-squared0.980287Mean dependent var1.361301Adjusted R-squared0.97831
5、6S.D. dependent var0.187659S.E. of regression0.027634Akaike info criterion-4.218445Sum squared resid0.015273Schwarz criterion-4.070337Log likelihood51.51212F-statistic497.2843Durbin-Watson stat1.877706Prob(F-statistic)0.000000通过比较可以看出,AIC值和SC值都变小了,所以应该去掉猪肉价格P2与牛肉价格P3这两个解释变量。所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生
6、显著影响。2. 表2列出了中国2012年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。序号工业总产值Y/亿元资产合计K/亿元职工人数L/万人序号工业总产值Y/亿元资产合计K/亿元职工人数L/万人13722.7003078.220113.000017812.70001118.81043.0000021442.5201684.43067.00000181899.7002052.16061.0000031752.3702742.77084.00000193692.8506113.110240.000041451.2901973.82027.000002
7、04732.9009228.250222.000055149.3005917.010327.0000212180.2302866.65080.0000062291.1601758.770120.0000222539.7602545.63096.0000071345.170939.100058.00000233046.9504787.900222.00008656.7700694.940031.00000242192.6303255.290163.00009370.1800363.480016.00000255364.8308129.680244.0000101590.3602511.99066
8、.00000264834.6805260.200145.000011616.7100973.730058.00000277549.5807518.790138.000012617.9400516.010028.0000028867.9100984.520046.00000134429.1903785.91061.00000294611.39018626.94218.0000145749.0208688.030254.000030170.3000610.910019.00000151781.3702798.90083.0000031325.53001523.19045.00000161243.0
9、701808.44033.00000设定模型为:(1)利用上述资料,进行回归分析;(2)回答:中国2000年的制造业总体呈现规模报酬不变状态吗?将模型进行双对数变换如下:1)进行回归分析:得到如下回归结果:于是,样本回归方程为: (1.59) (3.45) (1.79)从回归结果可以看出,模型的拟合度较好,在显著性水平0.1的条件下,各项系数均通过了t检验。从F检验可以看出,方程对Y的解释程度较少。表明,工业总产值对数值的79.6%的变化可以由资产合计对数与职工的对数值的变化来解释,但仍有20.4%的变化是由其他因素的变化影响的。从上述回归结果看,即资产与劳动的产出弹性之和近似为1,表明中国制
10、造业在2000年基本呈现规模报酬不变的状态。下面进行Wald检验对约束关系进行检验。过程如下:结果如下:由对应概率可以知道,不能拒绝原假设,即资产与劳动的产出弹性之和为1,表明中国制造业在2000年呈现规模报酬不变的状态。一、邹式检验(突变点检验、稳定性检验)1.突变点检验1995-2012年中国家用汽车拥有量(,万辆)与城镇居民家庭人均可支配收入(,元),数据见表3。表3 中国家用汽车拥有量()与城镇居民家庭人均可支配收入()数据年份(万辆)(元)年份(万辆)(元)199528.49739.12004205.423496.2199634.71899.62005249.964283199742
11、.291002.22006289.674838.9199860.421181.42007358.365160.3199973.121375.72008423.655425.1200081.621510.22009533.885854200196.041700.62010625.3362802002118.22026.62011770.786859.62003155.772577.42012968.987702.8下图是关于和的散点图:从上图可以看出,2006年是一个突变点,当城镇居民家庭人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验199
12、6年是不是一个突变点。H0:两个字样本(19952005年,20062012年)相对应的模型回归参数相等H1:备择假设是两个子样本对应的回归参数不等。在19952012年样本范围内做回归。在回归结果中作如下步骤:输入突变点:得到如下验证结果:由相伴概率可以知道,拒绝原假设,即两个样本(19952005年,20062012年)的回归参数不相等。所以,2006年是突变点。2.稳定性检验以表3为例,在用19952009年数据建立的模型基础上,检验当把20102012年数据加入样本后,模型的回归参数时候出现显著性变化。 因为已经知道2006年为结构突变点,所以设定虚拟变量:对19952012年的数据进
13、行回归分析:做邹氏稳定性检验:输入要检验的样本点:得到如下检验结果:由上述结果可以知道,F值对应的概率为0.73,所以接受原假设,模型加入2010、2011和2012年的样本值后,回归参数没有发生显著性变化。二、似然比(LR)检验有中国国债发行总量(,亿元)模型如下:其中表示国内生产总值(百亿元),表示年财政赤字额(亿元),表示年还本付息额(亿元)。19902011年数据见表4。表4 国债发行总量、财政赤字额、年还本付息额()数据199043.0145.17868.928.582001461.4216.178237.14246.81991121.7448.624-37.3862.8920026
14、69.68266.381258.83438.57199283.8652.94717.6555.522003739.22346.344293.35336.22199379.4159.34542.5742.4720041175.25467.594574.52499.36199477.3471.7158.1628.920051549.76584.781581.52882.96199589.8589.644-0.5739.5620061967.28678.846529.561355.031996138.25102.02282.950.1720072476.82744.626582.421918.371
15、997223.55119.62562.8379.8320083310.93783.452922.232352.921998270.78149.283133.9776.7620093715.03820.67461743.591910.531999407.97169.092158.8872.3720104180.1894.4222491.271579.822000375.45185.479146.49190.0720114604959.3332516.542007.73对以上数据进行回归分析:得到如下输出结果:对应的回归表达式为: (0.2) (2.2) (31.5) (17.8)现在用似然比(LR)统计量检验约束对应的回归系数等于零是否成立。过程如下:输入要检验的变量名:得到如下输出结果:输出结果上部是关于约束GDP系数为零的F检验和LR检验。由于两种检验的相应概率均小于0.05,即拒接原假设,GDP系数不为零,模型中应该保留解释变量GDP。输出结果下部是去掉了GDP变量的约束模型估计结果。三、Wald检验(以表4为例进行Wald检验,对输出结果进行检验。)检验过程如下:输入约束表达式:得到如下结果:从输出结果上部可以看出,相应概率非常大,远远大于0.05,表明原假设成立,即约束条件成立,是的3倍。输出结果的下部给出了约束条件的样本值和样本标准差,分别为0.04和0.48。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1