第6讲其他问题.pptx
《第6讲其他问题.pptx》由会员分享,可在线阅读,更多相关《第6讲其他问题.pptx(44页珍藏版)》请在冰豆网上搜索。
第六讲第六讲多元回归多元回归分析:
其他问题分析:
其他问题MultipleRegressionAnalysis:
FurtherIssues一、变量的一、变量的测量单位测量单位(DataScaling)二、函数二、函数形式形式(FunctionalForm)三、三、拟合优度拟合优度(Goodness-of-Fit)四、预测和四、预测和残差分析残差分析(PredictionandResidualAnalysis)第一节第一节变量的测量单位变量的测量单位(DataScaling)一、改变变量测量单位对一、改变变量测量单位对OLS的影响的影响1.改变变量测量单位的原因:
改变变量测量单位的原因:
u数据测度单位变换经常被用于减少被估参数小数点后的零的数据测度单位变换经常被用于减少被估参数小数点后的零的个数,这样结果更好看一些。
个数,这样结果更好看一些。
u有时候,为了解释的方便,我们需要改变自变量或因变量的有时候,为了解释的方便,我们需要改变自变量或因变量的测量单位测量单位。
既然这样做主要为了解释的方便,或者仅仅是结果更既然这样做主要为了解释的方便,或者仅仅是结果更好看,我们希望回归之后本质的东西并不会因为变量测量单位好看,我们希望回归之后本质的东西并不会因为变量测量单位的改变而改变。
的改变而改变。
2.改变变量测量单位对参数估计值的影响改变变量测量单位对参数估计值的影响u被解释变量测量单位改变被解释变量测量单位改变被解释变量测量单位改变后,新解释变量变为原来的被解释变量测量单位改变后,新解释变量变为原来的倍倍原模型:
原模型:
yi=bb0+bb1xi1+bb2xi2+ui新模型:
新模型:
yi=0+1xi1+2xi2+vi则有:
则有:
yi=bb0+bb1xi1+bb2xi2+ui因此:
因此:
0=bb01=bb12=bb2也就是说,被解释变量测量单位的改变,新的被解释变量变为也就是说,被解释变量测量单位的改变,新的被解释变量变为原来的原来的倍之后,会引起新模型中各参数的估计值变为原模型倍之后,会引起新模型中各参数的估计值变为原模型中相应参数估计值的相同倍数。
中相应参数估计值的相同倍数。
u解释变量测量单位的改变解释变量测量单位的改变假定因为解释变量测量单位的改变,新解释变量变为原来的假定因为解释变量测量单位的改变,新解释变量变为原来的倍倍原模型:
原模型:
yi=bb0+bb1xi1+bb2xi2+ui新模型:
新模型:
yi=0+1xi1+2xi2+vi因此:
因此:
0=bb01=bb1/2=bb2也就是说,解释变量测量单位的改变,使得新解释变量变为原也就是说,解释变量测量单位的改变,使得新解释变量变为原来的来的倍之后,会引起新模型中参数的估计值变为原模型中相倍之后,会引起新模型中参数的估计值变为原模型中相应参数估计值的应参数估计值的1/倍,但其他参数的估计值并不发生改变。
倍,但其他参数的估计值并不发生改变。
3.改变变量测量单位对拟合优度改变变量测量单位对拟合优度R2的影响的影响u被解释变量测量单位改变被解释变量测量单位改变原模型:
原模型:
yi=bb0+bb1xi1+bb2xi2+ui新模型:
新模型:
yi=0+1xi1+2xi2+vi0=bb01=bb12=bb2vi=uiu解释变量测量单位改变解释变量测量单位改变原模型:
原模型:
yi=bb0+bb1xi1+bb2xi2+ui新模型:
新模型:
yi=0+1xi1+2xi2+vi0=bb01=bb1/2=bb2vi=ui由此可见,不管是被解释变量还是解释变量的测量单位改变,都由此可见,不管是被解释变量还是解释变量的测量单位改变,都不会影响模型估计的拟合优度不会影响模型估计的拟合优度R2。
4.改变变量测量单位对参数显著性的影响改变变量测量单位对参数显著性的影响u被解释变量测量单位改变被解释变量测量单位改变原模型:
原模型:
yi=bb0+bb1xi1+bb2xi2+uiR12为将为将x1对其他所有解释变量(这里为对其他所有解释变量(这里为x2)进行回归(包含一个)进行回归(包含一个截距项)所得到的的拟合优度。
截距项)所得到的的拟合优度。
被解释变量测量单位改变并不能改变被解释变量测量单位改变并不能改变SST1以及以及R12。
但模型估计。
但模型估计的回归标准误差的回归标准误差会发生改变:
会发生改变:
回归标准误的改变并不意味着误差的缩小或者变大,只能回归标准误的改变并不意味着误差的缩小或者变大,只能表明测量单位的不同。
表明测量单位的不同。
因为回归标准误的变化,参数因为回归标准误的变化,参数11估计值的标准差变为原来的估计值的标准差变为原来的倍,但由于倍,但由于11的估计值也变为原模型中估计值的的估计值也变为原模型中估计值的倍。
倍。
参数参数11的的t统计量不变,即参数的显著性并不受影响。
统计量不变,即参数的显著性并不受影响。
u解释变量测量单位改变解释变量测量单位改变新模型:
新模型:
yi=0+1xi1+2xi2+vi0=bb01=bb1/2=bb2vi=ui解释变量测量单位改变并不改变回归标准误差解释变量测量单位改变并不改变回归标准误差:
又因为又因为R12不变,因此,不变,因此,参数参数11的标准误是原模型中的标准误是原模型中11标准误的标准误的1/倍,又因为它的估计值也变为原模型的倍,又因为它的估计值也变为原模型的1/倍,因此,参数倍,因此,参数11的的t统计量也不发生改变,即解释变量测量单位的改变也不能改统计量也不发生改变,即解释变量测量单位的改变也不能改变待估参数的显著性。
变待估参数的显著性。
值得注意的是,变量值得注意的是,变量x2的测量单位不变,它的估计值和标准误都的测量单位不变,它的估计值和标准误都不变,显著性也不发生改变。
不变,显著性也不发生改变。
5.改变变量测量单位对模型整体显著性的影响改变变量测量单位对模型整体显著性的影响无论是被解释变量还是解释变量的测量单位发生改变都不会改变无论是被解释变量还是解释变量的测量单位发生改变都不会改变回归的拟合优度回归的拟合优度R2,因此,变量测量单位的改变也不能改变模型,因此,变量测量单位的改变也不能改变模型整体的显著性。
整体的显著性。
6.改变变量测量单位对置信区间的影响改变变量测量单位对置信区间的影响u被解释变量测量单位改变被解释变量测量单位改变由于各参数估计值和标准差都变成原来的由于各参数估计值和标准差都变成原来的倍,因此,置信区间倍,因此,置信区间两端值也变成原来的两端值也变成原来的倍。
倍。
u解释变量测量单位改变解释变量测量单位改变参数参数11估计值和标准差都变成原来的估计值和标准差都变成原来的1/倍,因此,置信区间两倍,因此,置信区间两端值也变成原来的端值也变成原来的1/倍。
但参数倍。
但参数22估计值和标准差都不变,因估计值和标准差都不变,因此,其置信区间也不变。
此,其置信区间也不变。
u被解释变量测量单位改变,被解释变量测量单位改变,=1/16原模型回归结果:
原模型回归结果:
新模型回归结果:
新模型回归结果:
u解释变量测量单位改变,解释变量测量单位改变,=1/20原模型回归结果:
原模型回归结果:
新模型回归结果:
新模型回归结果:
Y
(1)bwght
(2)bwghtlbs(3)bwghtCigs-0.4634*(0.0916)t=-5.06-0.643,-0.284-0.0289*(0.0057)t=-5.06-0.040,-0.018-Packs-9.268*(1.832)t=-5.06-12.861,-5.675Faminc0.0927*(0.0292)t=3.180.036,0.1500.0058*(0.0018)t=3.180.002,0.0090.0927*(0.0292)t=3.180.036,0.150Intercept116.794*(1.049)t=111.51114.916,119.0327.3109*(0.0656)t=111.517.182,7.439116.974*(1.049)t=111.51114.916,119.032Obs138813881388R20.02980.02980.0298SSR557485.512177.5778557485.51SST574611.722244.5770574611.72SER20.0631.253920.063F-value21.2721.2721.27表表6.1通过上面的分析,我们发现:
当变量的测量单通过上面的分析,我们发现:
当变量的测量单位发生变化时,变量的估计系数、标准差和置信区间位发生变化时,变量的估计系数、标准差和置信区间有可能发生变化,但回归的一些本质性的东西,例如有可能发生变化,但回归的一些本质性的东西,例如参数的显著性,模型的显著性,模型的拟合优度等并参数的显著性,模型的显著性,模型的拟合优度等并不会发生变化。
不会发生变化。
因此,在适当的情况下,我们完全可以根据研因此,在适当的情况下,我们完全可以根据研究的需要以及其他方面的考虑调整变量的测量单位,究的需要以及其他方面的考虑调整变量的测量单位,对变量进行重新定义。
这么做并不会损坏问题的实质。
对变量进行重新定义。
这么做并不会损坏问题的实质。
7.变量以对数形式出现时改变测量单位变量以对数形式出现时改变测量单位u被解释变量为对数形式,且测量单位改变被解释变量为对数形式,且测量单位改变被解释变量测量单位改变后,新解释变量变为原来的被解释变量测量单位改变后,新解释变量变为原来的倍倍原模型:
原模型:
logyi=bb0+bb1xi1+bb2xi2+ui新模型:
新模型:
log(yi)=0+1xi1+2xi2+vi则有:
则有:
log(yi)=log+bb0+bb1xi1+bb2xi2+ui因此:
因此:
0=log+bb01=bb12=bb2也就是说,被解释变量为对数形式时,随着测量单位的改变,也就是说,被解释变量为对数形式时,随着测量单位的改变,新的被解释变量变为原来的新的被解释变量变为原来的倍之后,只会引起截距项的估计倍之后,只会引起截距项的估计值发生改变,并不会影响任何一个斜率估计值。
值发生改变,并不会影响任何一个斜率估计值。
u解释变量测量单位的改变解释变量测量单位的改变假定因为解释变量测量单位的改变,新解释变量变为原来的假定因为解释变量测量单位的改变,新解释变量变为原来的倍倍原模型:
原模型:
yi=bb0+bb1logxi1+bb2xi2+ui新模型:
新模型:
yi=0+1log(xi1)+2xi2+vi因此:
因此:
0=bb0-bb1log1=bb12=bb2也就是说,解释变量为对数形式时,因测量单位的改变,使得也就是说,解释变量为对数形式时,因测量单位的改变,使得新解释变量变为原来的新解释变量变为原来的倍之后,只引起截距项的估计值发生倍之后,只引起截距项的估计值发生改变,并不会影响任何一个斜率估计值。
改变,并不会影响任何一个斜率估计值。
变量为对数形式时,测量单位变化对其他估计量的影响请自己变量为对数形式时,测量单位变化对其他估计量的影响请自己分析。
分析。
二、标准化系数二、标准化系数(BetaCoefficients)1.定义定义当我们把被解释变量当我们把被解释变量y和各解释变量和各解释变量xj进行标准化处理(也就是,进行标准化处理(也就是,减去其各自的均值后除以其各自的标准离差)之后进行回归,所减去其各自的均值后除以其各自的标准离差)之后进行回归,所得到的参数估计值就是相应解释变量的标准化系数。
得到的参数估计值就是相应解释变量的标准化系数。
标准化系数反映解释变量标准化系数反映解释变量xj变动一单位的标准离差时被解释变变动一单位的标准离差时被解释变量量y变动的标准离差。
变动的标准离差。
2.使用标准化系数的原因使用标准化系数的原因u