1、第五章第五章 多元线性回归模型多元线性回归模型第二部分第二部分-模型的检验模型的检验模型统计检验的实质模型统计检验的实质一、拟合优度检验二、方程显著性检验(F检验)三、变量显著性检验(t检验)四、实例五、置信区间模型统计检验的实质模型统计检验的实质n n根据样本提供的信息,承担给定的风险下,对根据样本提供的信息,承担给定的风险下,对未知总体分布的某些方面作出合理的判断,称未知总体分布的某些方面作出合理的判断,称为统计假设检验,简称假设检验为统计假设检验,简称假设检验n n模型统计检验不涉及模型的经济内涵模型统计检验不涉及模型的经济内涵n n旨在检验模型是否满足数学理论与方法上的要旨在检验模型是
2、否满足数学理论与方法上的要求求统计差异显著性统计差异显著性n n拟合优度检验(拟合优度检验(R R2 2)、)、方程差异显著性检验方程差异显著性检验(F F)和变量差异显著性检验(和变量差异显著性检验(t t)通称称为模通称称为模型的统计检验。型的统计检验。n n统计检验的结果表明模型是否能代表数据,或统计检验的结果表明模型是否能代表数据,或者说观察到的事实是否支持模型。者说观察到的事实是否支持模型。返回返回 2一、拟合优度检验一、拟合优度检验n n检验模型对样本的拟合程度检验模型对样本的拟合程度称为拟合优度。称为拟合优度。n nLSLS的优良性指的是不同方法的优良性指的是不同方法对同一问题的
3、判断。对同一问题的判断。n n拟合优度检验指的是对不同拟合优度检验指的是对不同问题之间的比较。问题之间的比较。n n方法:构造一个表征拟合程方法:构造一个表征拟合程度的指标,根据一定准则进度的指标,根据一定准则进行判断。行判断。n n例如左边两个问题,它们都例如左边两个问题,它们都满足满足LSLS,但拟合程度明显但拟合程度明显不同。不同。31总平方和总平方和=解释平方和解释平方和+残差平方和残差平方和4为什么为什么ESS是是由解释变量引起的变动?由解释变量引起的变动?5为什么为什么ESS是由解释变量引起的变动是由解释变量引起的变动?n nESSESS是一个变动是一个变动n nESSESS是由解
4、释变量的变动决定的是由解释变量的变动决定的n nESSESS是被解释变量变动的一部分是被解释变量变动的一部分6平方和分解图示平方和分解图示正交分解正交分解(yi,xi)7名词对照名词对照n nTotal Square SumTotal Square Sumn nExplain Square SumExplain Square Sumn nResidual Square SumResidual Square Sumn nn nTotal Square SumTotal Square Sumn nError Square SumError Square Sumn nRegression Squar
5、e SumRegression Square Sumn n总平方和总平方和n n解释平方和解释平方和n n残差平方和残差平方和n nn n总平方和总平方和n n误差平方和误差平方和n n(残差平方和)(残差平方和)n n回归平方和回归平方和n n(解释平方和)(解释平方和)82、拟合优度、拟合优度R2和调整了的和调整了的R2n nr r2 2 拟合优度(判定系数、决定系数)拟合优度(判定系数、决定系数)n nR R2 2调整了的拟合优度调整了的拟合优度9可决系数(拟合优度)可决系数(拟合优度)R R2 2n n解释变量引起的变动占总变动的百分比解释变量引起的变动占总变动的百分比n n取值在取值
6、在0101之间,越大拟合越好之间,越大拟合越好10调整了的调整了的R2n n用残差平方和与总平方和各自的自由度进行调整。用残差平方和与总平方和各自的自由度进行调整。以防止企图通过增加解释变量个数来提高拟合优以防止企图通过增加解释变量个数来提高拟合优度的错误倾向。度的错误倾向。11引入调整可决系数的作用引入调整可决系数的作用 返回返回12二、方程显著性检验(二、方程显著性检验(F检验)检验)依据假设检验的原理和步骤,把模型作为一个依据假设检验的原理和步骤,把模型作为一个整体进行假设检验,检验模型中被解释变量整体进行假设检验,检验模型中被解释变量与解释变量之间的线性关系是否显著的成立。与解释变量之
7、间的线性关系是否显著的成立。13F检验统计量的构造检验统计量的构造14F检验的逻辑意义检验的逻辑意义15拟合优度与方程显著性检验的关系拟合优度与方程显著性检验的关系n n拟合优度检验模型对样本的拟合程度。拟合优度检验模型对样本的拟合程度。n nF F显著性性检验检验模型总体线性关系的显著性。显著性性检验检验模型总体线性关系的显著性。n n两者有如上的关系。两者有如上的关系。n n拟合优度是感性的,不宜苛求,应以拟合优度是感性的,不宜苛求,应以F F检验为准。检验为准。但但F F检验它只是把模型作为一个整体进行了检验,检验它只是把模型作为一个整体进行了检验,还应对模型中的各个变量进行检验,决定它
8、们是还应对模型中的各个变量进行检验,决定它们是否应当保留在模型之中。否应当保留在模型之中。16F检验的步骤检验的步骤n n假定随机扰动项假定随机扰动项u u服从正态分布。检验目标是联合检验,服从正态分布。检验目标是联合检验,n n(1 1)提出假设)提出假设HH0 0:b:b1 1=b=b2 2=b=b3 3=b bk k=0=0n n(2 2)适合的检验统计量适合的检验统计量n n(3 3)根据冒险率)根据冒险率,确定临界值,确定临界值F F n n(4 4)将计算出的将计算出的F F与临界值与临界值F F 比较比较n n(5 5)下下结结论论:若若FF临临界界值值F F,则则拒拒绝绝HH0
9、 0;若若F=Ft,拒绝H0;否则不拒绝H0。t的绝对值越大,自变量对因变量的作用越显著。21不拒绝H0区域t f(t)拒绝域拒绝域t检验的拒绝域检验的拒绝域22回归模型假设检验的步骤回归模型假设检验的步骤n n(1 1)查看拟合优度,进行)查看拟合优度,进行F F检验,从整体上判检验,从整体上判断回归方程是否成立,如果断回归方程是否成立,如果F F检验通不过,无检验通不过,无须进行下一步;否则进行下一步须进行下一步;否则进行下一步n n(2 2)查看各个变量的)查看各个变量的t t值及其相应的概率,进值及其相应的概率,进行行t t检验,如果相应的概率小于给定的显著水平,检验,如果相应的概率小
10、于给定的显著水平,该自变量的系数显著地不为该自变量的系数显著地不为0 0,该自变量对因,该自变量对因变量作用显著;否则系数与变量作用显著;否则系数与0 0无显著差异(本无显著差异(本质上质上=0=0),该自变量对因变量无显著的作用,),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。应从方程中删去,重新估计方程。n n(3 3)但是,一次只能将最不显著(相应概率)但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。最大)的删除。每次删除一个,直至全部显著。返回返回23四、运用实例四、运用实例n n数据:(见下页)n n资料来源:易丹辉统计预测n n被解释变量
11、:y蔬菜销售量n n解释变量:x1、x2、x3、x4、x5、x6包括人口、价格、粮食、副食等因素n n要求:建立简洁的(最优的)蔬菜供应模型24资料资料25应剔除最不显著的x526设置新的估计模型27应剔除不显著的X628应剔除不显著的X329得到最简洁的蔬菜供应模型30最简洁的蔬菜供应模型最简洁的蔬菜供应模型n nEstimation Command:n nLS Y X1 X2 X4 Cn nEstimation Equation:n nY=C(1)*X1+C(2)*X2+C(3)*X4+C(4)n nSubstituted Coefficients:n nY=0.015753046*X1-
12、0.46540629*X2+0.16284733*X4+1.8427109n n最后保留的解释变量:人口、价格和收入返回返回31五、参数估计的置信区间五、参数估计的置信区间n n用样本提供的信息,根据估计量用样本提供的信息,根据估计量(统计量统计量)公式,公式,可以给出未知参数的估计值或被解释变量的预可以给出未知参数的估计值或被解释变量的预测值的估计值,这种估计称为点估计。显然点测值的估计值,这种估计称为点估计。显然点估计没有给出做出进行这类判断的可靠程度和估计没有给出做出进行这类判断的可靠程度和误差范围。误差范围。n n区间估计则是以一定的可靠程度(精确度)区间估计则是以一定的可靠程度(精确
13、度),给出估计值存在的误差范围(区间)。给出估计值存在的误差范围(区间)。n n因为估计量是一个随机变量,所以区间估计的因为估计量是一个随机变量,所以区间估计的实质,是为被估计的参数或预测值构造一个以实质,是为被估计的参数或预测值构造一个以点估计为中心的区间(置信区间),该区间以点估计为中心的区间(置信区间),该区间以一定的概率(置信度一定的概率(置信度=1-=1-)包含该参数或预测包含该参数或预测值。值。32参数估计的置信区间参数估计的置信区间33可靠性和估计精度是相互制约可靠性和估计精度是相互制约n n1 1、提高可靠性(减少风险),区间、提高可靠性(减少风险),区间增大,反之,则反。因为
14、信息量只有增大,反之,则反。因为信息量只有这么多。这么多。n n2 2、增加样本容量、增加样本容量t t临界值减小和系临界值减小和系数标注误减小(它的分子不增它,分数标注误减小(它的分子不增它,分母增大)母增大)误差半径减小误差半径减小n n3 3、提高拟合优度(减少、提高拟合优度(减少RSSRSS)n n4 4、提高样本观察值的分散度。提高样本观察值的分散度。n n5 5、置信区域是一个以置信区域是一个以 为中心的超为中心的超椭球椭球n n大量观察大量观察n n深入观察深入观察n n全面观察全面观察34预测时间轴的分段预测时间轴的分段35参数的区间估计参数的区间估计36b f(b)置信区间上限下限假设检验与区间估计是一个问题的两个方面37b f(b)置信区间上限下限 返回返回 38预测假定预测假定39均值预测(均值预测(E(YE(YF F))40个值预测(个值预测(Y YF F)置信区域是一个以YF为中心的超椭球。41预测能力检验预测能力检验42影响预测值精度的因素影响预测值精度的因素n n1、预测精度提高(半径减少)和可靠程度提高(风险减少)是相互制约的n n2、增加观察值个数n n3、提高拟合优度n n4、扩大解释变量的分散程度n n5、在解释变量均值向量处,有最小的预测误差43均值预测和个值预测的比较均值预测和个值预测的比较返回返回44
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1