ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:148.16KB ,
资源ID:750502      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/750502.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(3多元线性回归与最小二乘估计.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

3多元线性回归与最小二乘估计.docx

1、3多元线性回归与最小二乘估计1.3 多元线性回归与最小二乘估计1假定条件、最小二乘估计量和高斯马尔可夫定理 多元线性回归模型:yt = 0 + 1xt1 + 2xt2 + k- 1xt k -1 + ut , (1.1)其中yt是被解释变量(因变量),xt j是解释变量(自变量),ut是随机误差项, i, i = 0, 1, , k - 1是回归参数(通常未知)。 对经济问题的实际意义:yt与xt j存在线性关系,xt j, j = 0, 1, , k - 1, 是yt的重要解释变量。ut代表众多影响yt变化的微小因素。使yt的变化偏离了E( yt) = 0 + 1xt1 + 2xt2 + k

2、- 1xt k -1 决定的k维空间平面。 当给定一个样本(yt , xt1, xt2 , xt k -1), t = 1, 2, , T时, 上述模型表示为 y1 = 0 + 1x11 + 2x12 + k- 1x1 k -1 + u1, 经济意义:xt j是yt的重要解释变量。 y2 = 0 + 1x21 + 2x22 + k- 1x2 k -1 + u2, 代数意义:yt与xt j存在线性关系。 . 几何意义:yt表示一个多维平面。 yT = 0 + 1x T 1 + 2x T 2 + k- 1x T k -1 + uT, (1.2)此时yt与x t i已知, j与 ut未知。 (1.3

3、) Y = X + u , (1.4)为保证得到最优估计量,回归模型(1.4)应满足如下假定条件。假定 随机误差项ut是非自相关的,每一误差项都满足均值为零,方差 2相同且为有限值,即E(u) = 0 = , Var (u) = E( ) = 2I = 2假定 解释变量与误差项相互独立,即 E(X u) = 0假定 解释变量之间线性无关。rk(X X) = rk(X) = k 其中rk( )表示矩阵的秩。假定 解释变量是非随机的,且当T 时T 1X X Q 其中Q是一个有限值的非退化矩阵。最小二乘 (OLS) 法的原理是求残差(误差项的估计值)平方和最小。代数上是求极值问题。minS = (Y

4、 - X) (Y - X) = Y Y -X Y - Y X +X X = Y Y - 2X Y + X X (1.5)因为Y X是一个标量,所以有Y X = X Y。(1.5) 的一阶条件为:= - 2X Y + 2X X= 0 (1.6)化简得 X Y = X X因为 (X X) 是一个非退化矩阵(见假定),所以有= (X X)-1 X Y (1.7)因为X的元素是非随机的,(X X) -1X是一个常数矩阵,则是Y的线性组合,为线性估计量。求出,估计的回归模型写为Y = X+ (1.9)其中= ( ) 是 的估计值列向量,= (Y - X) 称为残差列向量。因为 = Y - X= Y -

5、X (X X)-1X Y = I - X (X X)-1 X Y (1.10)所以也是Y的线性组合。的期望和方差是 E() = E(X X)-1 X Y = E(X X)-1X (X + u) = + (X X)-1X E(u) = (1.11)Var() = E( ) ( )= E(X X)-1X u u X (X X)-1 = E(X X)-1X 2I X (X X)-1 = 2 (X X)-1 (1.12) 高斯马尔可夫定理:若前述假定条件成立,OLS估计量是最佳线性无偏估计量。具有无偏性。具有最小方差特性。具有一致性,渐近无偏性和渐近有效性。2. 残差的方差s2 = / (T - k)

6、 (1.13)s 2是 的无偏估计量,E(s 2 ) = 。的估计的方差协方差矩阵是() = s (X X)-1 (1.14)3. 多重确定系数(多重可决系数)Y = X+=+ (1.15)总平方和 SST = = Y Y - T, (1.16)其中是yt 的样本平均数,定义为= 。回归平方和为SSR = = - T (1.17)其中的定义同上。残差平方和为SSE = = = (1.18)则有如下关系存在, SST = SSR + SSE (1.19) R2 = (1.20)显然有0 R 2 1。R 2 1,拟合优度越好。 4. 调整的多重确定系数当解释变量的个数增加时,通常R2不下降,而是上

7、升。为调整因自由度减小带来的损失,又定义调整的多重确定系数如下: = 1 - = 1 - (1.21) 5. OLS估计量的分布 若u N (0, I ) ,则每个ut都服从正态分布。于是有Y N (X , I ) (1.22)因也是u的线性组合(见公式1.7),依据(1.11)和(1.12)有 N ( , (X X)-1 ) (1.23) 6. 方差分析与F检验与SST相对应,自由度T-1也被分解为两部分,(T-1)= (k -1) + (T- k) (1.24) 回归均方定义为MSR = ,误差均方定义为MSE = 表1.1 方差分析表方差来源平方和自由度均方回归SSR =-T2k-1MS

8、R = SSR / (k-1)误差SSE = T-kMSE = SSE / (T-k)总和SST= Y Y - T2T-1H0: 1= 2 = = k-1 = 0; H1: j不全为零F = = F(k-1,T-k) (1.25)设检验水平为 ,则检验规则是,若 F F (k-1,T-k),接受H0;若 F F (k-1,T-k) , 拒绝H0。 0 F (k-1, T-k) -t (T-k) 0 t (T-k)F检验示意图 t检验示意图7t检验H 0: j = 0, (j = 1, 2, , k-1), H 1: j 0t = t(T-k) (1.26)判别规则:若 t t k 接受H 0;

9、若 t t k 拒绝H 0。 8 i的置信区间 (1) 全部 i的联合置信区间接受F = ( -) (X X) ( -) / s2 F (k, T-k) (1.27)( -) (X X ) ( -) s2 k F (k, T-k),它是一个k维椭球。 (1.28) (2) 单个 i的置信区间 i = s t k . (1.29) 9预测 (1)点预测C = (1 xT+1 1 xT+1 2 xT+1 k-1 ) (1.30)则T + 1期被解释变量yT+1的点预测式是,= C=0 +1 xT+1 1 + + k-1 xT+1 k-1 (1.31) (2)E(yT+1) 的置信区间预测 首先求点

10、预测式C的抽样分布E() = E(C) = C (1.32)Var() = Var(C) = E(C- C ) (C- C ) = EC (- ) C (- ) = C E(- ) (- ) C = C Var()C = C 2 (X X )-1C = 2 C (X X )-1C , (1.33)因为服从多元正态分布,所以C也是一个多元正态分布变量,即= C N (C , 2C (X X ) -1C ) (1.34)构成 t 分布统计量如下t = t (T-k) (1.35)置信区间 C t /2 (1, T-k) s (1.36) (3) 单个yT+1的置信区间预测yT+1值与点预测值有以下

11、关系 yT+1 = + uT+1 (1.37)其中uT+1是随机误差项。因为E( yT+1) = E(+ uT+1) = C (1.38) Var( yT+1) = Var() + Var(uT+1) = 2 C (X X)-1C + 2 = 2 (C (X X)-1C + 1) (1.39)因为服从多元正态分布,所以yT+1也是一个多元正态分布变量,即yT+1 N (C , 2C (X X ) -1C + 1)与上相仿,单个yT+1的置信区间是C t /2 (T-k) s (1.40) 计算举例:(见计量经济分析第19-27页,熟悉矩阵运算)10. 预测的评价指标注意,以下6个公式中的et表

12、示的是预测误差,不是残差。可以在样本内、外预测。(1)预测误差。预测误差定义为et = - yt, t = T+1, T+2, 是对单点预测误差大小的测量。(2)相对误差PE (Percentage Error)。 PE = , t = T+1, T+2, 是对单点预测相对误差大小的测量。(3) 误差均方根rms error (Root Mean Squared Error) rms error = 通过若干个预测值对预测效果进行综合评价。(4) 绝对误差平均MAE (Mean Absolute Error) MAE = 通过若干个预测值对预测的绝对误差进行综合评价。(5) 相对误差绝对值平均

13、MAPE (Mean Absolute Percentage Error) MAPE = 综合运用以上4种方法,通过若干个预测值对预测的相对误差进行综合评价。以上6个式子中,表示预测值,yt表示实际值。Theil的取值范围是 0,1。显然在预测区间内,当与yt完全相等时,Theil = 0;当预测结果最差时,Theil = 1。公式中的累加范围是用1至T表示的,当然也可以用于样本外预测评价。11建模过程中应注意的问题(1)研究经济变量之间的关系要剔除物价变动因素。以上图为例,按当年价格计算,我国1992年的GDP是1980年的5.9倍,而按固定价格计算,我国1992年的GDP是1980年的2.

14、8倍。另外从图中还可看出,1980-1992期间按名义价格计算的GDP曲线一直是上升的,而按不变价格(1980年价格)计算的GDP曲线在1989年出现一次下降。可见研究经济变量应该剔除物价变动因素。 (2) 依照经济理论以及对具体经济问题的深入分析初步确定解释变量。例:我国粮食产量 = f(耕地面积、农机总动力、施用化肥量、农业人口等)。但根据我国目前情况,“耕地面积”不是“粮食产量”的重要解释变量。粮食产量的提高主要来自科技含量的提高。例:关于某市的食用油消费量,文革前常驻人口肯定是重要解释变量。现在则不同,消费水平是重要解释变量,因为食用油供应方式已改变。(3) 当引用现成数据时,要注意数据的定义是否与所选定的变量定义相符。 例:“农业人口”要区别是“从事农业劳动的人口”还是相对于城市人口的“农业人口”。 例:2002年起

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1