1、整理多元线性回归分析多元线性回归分析直线回归概念复习例:为了研究3岁至8岁男孩身高与年龄的规律,在某地区在3岁至8岁男孩中随机抽样,共分6个年龄层抽样:3岁,4岁,8岁,每个层抽10个男孩,共抽60个男孩。资料如下:60个男孩的身高资料如下年龄3岁4岁5岁6岁7岁8岁身高92.596.5106.0115.5125.5121.597.0101.0104.0115.5117.5128.596.0105.5107.0111.5118.0124.096.5102.0109.5110.0117.0125.597.0105.0111.0114.5122.0122.592.099.5107.5112.511
2、9.0123.596.5102.0107.0116.5119.0120.591.0100.0111.5110.0125.5123.096.0106.5103.0114.5120.5124.099.0100.0109.0110.0122.0126.5平均身高95.4101.8107.6113.1120.6124.0从散点图上,我们可以发现样本点(X,Y)随机地出现在一条直线附近,并且从资料背景上考察,同一年龄的儿童身高应近似服从一个正态分布,而儿童身高的总体均数应随着年龄增长而增大,并由每个年龄的身高样本均数与儿童年龄的散点图可以发现:这些点非常接近一条直线以及样本均数存在抽样误差,因此推测儿童
3、身高的总体均数与年龄可能呈直线关系。故假定身高Y在年龄X点上的总体均数与X呈直线关系。其中y表示身高,x表示年龄。由于身高的总体均数与年龄有关,所以更准确地标记应为表示在固定年龄情况下的身高总体均数。身高的样本均数与年龄的散点图故有理由认为身高的总体均数与年龄的关系可能是一条直线关系上述公式称为直线回归方程。其中为回归系数(regression coefficient),或称为斜率(slope);称为常数项(constant),或称为截距(intercept)。回归系数表示x变化一个单位y平均变化个单位。当x和y都是随机的,x、y间呈正相关时0,x、y间呈负相关时 F = 0.0000 Res
4、idual | 447.467619 58 7.71495895 R-squared = 0.9306-+- Adj R-squared = 0.9294 Total | 6445.18333 59 109.240395 Root MSE = 2.7776- y | Coef. Std. Err. t P|t| 95% Conf. Interval-+- x | 5.854286 .2099654 27.88 0.000 5.433994 6.274577 _cons | 78.18476 1.209202 64.66 0.000 75.76428 80.60524-回归方程 b=5.8542
5、86 , a= 78.18476se(b)= 0.2099654 回归系数检验:H0:=0 vs H1:0回归系数统计量t=b/se(b)= 5.854286/ .2099654=27.88,P值 F = 0.0232残差平方和残差均方和决定系数Residual982143.457140306.207R-squared = 0.6587校正和决定系数Adj R-squared = 0.5611Total2877250.009319694.444Root MSE = 374.57总平方和SS总描述样本量为n10的因变量y总的变异。回归平方和SSR描述了样本量为n时,由自变量x1,x2变化而引起的因变量y的这部分变异,SSe描述了样本量为n时,由随机误差项所引起的因变量y的一部分变异,因此:总变异自变量引起y的变异随机误差引起变异对应:SS总SS回归SS误差由于SS总,SS回归和SS误差均与样本量n有关,样本量n越大,对应变异就越大。所以取平均变异指标:均方差MS,回归系数回归系数标准误t值P值95可信区间yCoef.Std.Err.tP|t|95% Conf. Intervalx1113.998738.311092.9760.02123.4074120
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1