1、线性回归分析的基本步骤线性回归分析的基本步骤步骤一、建立模型知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。特点:由于随机误差项U的存在,使得Y和X不在一条直线/平面上。例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X)与每周消费(Y)数据如下:每周收入(X)每周消费支出(Y)80556065707510065707480858812079849094981408093951031081131151601021071101161181251801101151201301351402001201
2、36140144145220135137140152157160162240137145155165175189260150152175178180185191作出其散点图如下:总体回归方程(线):由于假定,因此因变量的均值与自变量总处于一条直线上,这条直线就称为总体回归线(方程)。总体回归方程的求法:以例1的数据为例1)对第一个Xi,求出E(Y|Xi)。每周收入(X)每周消费支出(Y)E(Y|Xi)80556065707565100657074808588771207984909498891408093951031081131151011601021071101161181251131801
3、10115120130135140125200120136140144145137220135137140152157160162149240137145155165175189161260150152175178180185191173由于,因此任意带入两个Xi和其对应的E(Y|Xi)值,即可求出,并进而得到总体回归方程。如将代入可得:以上求出反映了E(Y|Xi)和Xi之间的真实关系,即所求的总体回归方程为:,其图形为:样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。如在例1中,通过抽样考察,我们得到了20个家庭的样本数据:每周收入(X)每周消费支出(Y)80551006570
4、12079841408093160102107110180110200120136220135137240137145260150152175那么描述样本数据中因变量Y和自变量X之间非确定依赖关系的模型就称为样本回归模型。样本回归方程(线):通过样本数据估计出,得到样本观测值的拟合值与解释变量之间的关系方程称为样本回归方程。如下图所示:四者之间的关系:总体回归模型建立在总体数据之上,它描述的是因变量Y和自变量X之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,它描述的是因变量Y和自变量X之间的近似于真实的非确定型依赖关系。这种近似表现在两个方面:一是结构参数是其真实值的一种近似
5、估计;二是残差是随机误差项U的一个近似估计;:总体回归方程是根据总体数据得到的,它描述的是因变量的条件均值E(Y|X)与自变量X之间的线性关系;样本回归方程是根据抽样数据得到的,它描述的是因变量Y样本预测值的拟合值与自变量X之间的线性关系。:回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果足够接近真实值。由于抽样数据有多种可能,每一次抽样所得到的估计值都不会相同,即的估计量是一个随机变量。因此必须选择合适的参数估计方法,使其具有良好的统计性质。2、随机误差项U存在的原因:非重要解释变量的省略人的随机行为数学模型形式欠妥归并误差(如一国GDP的计算)测量误差等3、多元回归模型的基本假定随机误差项的期望值为零随机误差项具有同方差性随机误差项彼此之间不相关解释就变量X1,X2,Xk为确定型变量,与随机误差项彼此不相关。解释就变量X1,X2,Xk之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵X为满秩矩阵:rank(X)=k+1n
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1