1、4.3 样本的相关系数4第5章 回归模型的建立5第6章 回归模型的检验66.1 F检验66.2 T检验及模型的T检验分析76.2.1 T检验76.2.2 T检验分析76.3 偏相关性10第7章 违背模型基本假设的情况117.1 异方差性的检验117.1.1 残差图检验117.1.2 怀特(White)检验127.2 自相关性的检验127.3 多元加权最小二乘估计127.3.1 权函数自变量的选取137.3.2 Weight Estimate估计幂指数m137.3.3 加权最小二乘估计拟合14第8章 自变量选择与逐步回归158.1 前进逐步回归158.2 后退逐步回归17第9章 多重共线性的情形
2、及处理189.1 多重共线性的诊断189.2 多重共线性的消除20第10章 回归模型总结24参考文献2526 第1章 题目叙述 理论上认为影响成品钢材的需求量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了我国成品钢材的需求量,选择与其相关的八个因素:原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,19801998年的有关数据如下表。本题旨在通过建立这些经济变量的线性模型来说明影响成品钢材需求量的原因。 数据来源:易丹辉.数据分析与EViews应用.中国人民大学出版社.2008(教材第85页) 原
3、始数据(中国统计年鉴):年份成品钢材(万吨)原油(万吨)生铁(万吨)原煤(亿吨)发电量(亿千瓦时)铁路货运量(万吨)固定资产投资额(亿元)居民消费(亿元)19802716.2105953802.46.23006.2111279910.92317.119812670.1101223416.63092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.51984337211461.340017.8937701240741832.93674.5198
4、5369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.65175198743561341455039.2849731406533791.75961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113.21991563814009.2676510.8767751528935594.51
5、0315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.51839516266313072.315682.41994848214608.2974112.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432152.319979978.9316074.1411511.4113.7311355.
6、5316973422913.534854.6第2章 问题假设 为了问题的简洁明了,现对题目中的变量给出以下假设:中国成品钢材的需求量为(万吨)、原油产量(万吨)、生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)作为影响变量,而且本题收集的数据均为定量变量,其符号和经济意义如下表:变量符号代表意义中国成品钢材的需求量为(万吨)成品钢材需求总量原油产量(万吨)原油工业发展水平生铁产量(万吨)生铁工业发展水平原煤产量(亿吨)原煤工业发展水平发电技术水平运输产业水平固定资产支出水平居民支出水平政府消费(亿元)政府支出
7、水平第3章 问题分析 在上述问题中,中国成品钢材的需求量(万吨)的影响因素不只是原油产量(万吨),还有生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)等,这样因变量就与多个自变量有关。因此,我们就可以采用多元线性回归进行问题的分析。 多元线性回归模型的基本形式:设随机变量与一般变量的理论线性回归模型为: 其中,是个未知参数,称为回归常数,称为回归系数。称为被解释变量(因变量),而是个可以精确测量并可控制的一般变量,称为解释变量(自变量)。是随机误差,与一元线性回归一样,对随机误差项我们常假定 称 为理论回归方
8、程。第4章 数据的预处理4.1 曲线统计图 分析:从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;从1986年到1993年,个变量开始缓慢增长;从1993年到1998年,增长的幅度开始加大了。的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。 分析:从散点统计图上我们可以细致的来看,变量(铁路运货量)的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为一些特殊事件而导致的铁路运输量降
9、低。与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开始缓慢增长;但是(原油)与(原煤)的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。4.3 样本的相关系数从样本的相关系数表来看,各变量的相关系数都在0.9以上,说明自变量与因变量有高度的线性相关性,适合做与8个自变量的多元线性回归。(说明:本表格是由EViews软件计算得出,但由于不能导出,所以通过保存成图片后经WPS截图工具截得。)第5章 回归模型的建立 将原始数据导入到spss19.0(简体中文版)的数据框中,然后用spss19.0软件回归线性分析得到下列表:模型汇总模型RR
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1