VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx

上传人:b****2 文档编号:14735675 上传时间:2022-10-24 格式:DOCX 页数:57 大小:57.28KB
下载 相关 举报
VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx_第1页
第1页 / 共57页
VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx_第2页
第2页 / 共57页
VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx_第3页
第3页 / 共57页
VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx_第4页
第4页 / 共57页
VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx_第5页
第5页 / 共57页
点击查看更多>>
下载资源
资源描述

VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx

《VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx》由会员分享,可在线阅读,更多相关《VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx(57页珍藏版)》请在冰豆网上搜索。

VR虚拟现实第五章虚拟与离散变量回归模型Word下载.docx

5

6

7

8

9

10

工资

22.0

19.0

18.0

21.7

18.5

21.0

20.5

17.0

17.5

21.2

性别

我们以性别为自变量建立回归模型

(5.1.1)

对于表中资料回归得

它表示,女性的平均工资为18,男性的平均工资为18+3.28=21.28。

由于回归系数β1的t统计量为7.44,远大于临界值0.44,非常显著,故认为该项工作男女工资存在差别。

一般地,对模型(5.1.1)

(5.1.2)

(5.1.3)

若β1显著性检验通过,应认为Di的属性集合存在显著差别。

上面的模型除了考虑性别外,没有考虑任何其它因素。

如果考虑其它因素对工资的影响,比如工龄,可以取实际数值,以X表示,则有模型

(5.1.4)

此时

(5.1.5)

(5.1.6)

如果系数β1是统计显著的,表示工资还是存在性别差异。

如果某个因素有3个属性,能不能用这种两项选择的开关变量表示呢?

可以使用两个开关变量。

比如学位分3个等级:

学士,硕士,博士,就引进

建立如下模型

(5.1.7)

(5.1.8)

(5.1.9)

(5.1.10)

不过更多的情况是将两个虚拟变量用来区分两个因素,如用D1区分性别,用D2区分肤色,等等。

可以使用更多的虚拟变量,如有人研究业余兼职者的工资状况,建立过如下的回归方程

(5.1.11)

式中X1是第一职业工资,D2~D5都是开关变量,用来区分肤色(白人,非白人),居住地(城区,非城区),地域(西部,非西部),学历(高等教育,非高等教育)。

X6是年龄。

这一段谈到的都是虚拟变量作加项,它影响回归方程的均值。

二、虚拟变量作乘项,储蓄与收入分段拟合比较

这一段考虑虚拟变量作乘项,它影响回归方程的斜率。

开始我们也看一个具体的数值例子。

表5.1.2是英国1946~1963年居民储蓄与收入资料,单位是百万英镑。

表5.1.2

年份

储蓄

收入

1946

0.36

8.8

1955

0.59

15.5

1947

0.21

9.4

1956

0.90

16.7

1948

0.08

10.0

1957

0.95

17.7

1949

0.20

10.6

1958

0.82

18.6

1950

0.10

11.0

1959

1.04

19.7

1951

0.12

11.9

1960

1.53

21.1

1952

0.41

12.7

1961

1.94

22.8

1953

0.50

13.5

1962

1.75

23.9

1954

0.43

14.3

1963

1.99

25.2

表上粗略显示,资料可以分为两个时期:

1946~1954年为战后恢复时期,1955~1963年为振兴时期。

我们可以分别建立两个回归方程

(5.1.12)

(5.1.13)

对于本例具体资料,可以回归得

(5.1.14)

(5.1.15)

两个方程的斜率不一样,反映储蓄增长速度后来加快了。

要检验这组资料是否真的应该划分为两组,建立两个回归模型,或说要检验这两个回归方程是否有显著性差别,可以使用Chow检验法(具体方法在后面介绍)。

但是,一组资料用两个方程描述会带来诸多不便。

使用虚拟变量,可以用一个方程描述回归方程斜率参数(非常数因子)的变化。

对于本例资料,可以建立如下方程

(5.1.16)

其中Y为储蓄,X为收入,D为二值虚拟变量

(5.1.17)

(5.1.18)

对于本例资料,可以计算得回归方程

(5.1.19)

取Di=0,则

(5.1.20)

取Di=1,则

(5.1.21)

与两个方程效果是一致的(末位数含有舍入误差)。

效果是一致的,为什么要采用一个方程而不用两个方程?

除了便于统一处理外,一个方程很大的优点是增加了自由度,从而增加了参数估计的精度。

样本数几乎增加一倍,而因增加变量数仅减少两个自由度,我们知道自由度=n-m。

有人使用虚拟变量建立失业率与工作空位率之间的关系,也是有一个参数变化点:

(5.1.22)

这里UN是失业率(unemplogmentrate),V是工作空位率(job-vacancyrate),D是二值开关变量。

有人建立起服装消费与性别、文化教育的关系,使用两个开关变量

(5.1.23)

这里Y是服装的消费量,X是收入,D1用来区分性别,D2用来区分受教育程度。

由于考虑女性受过高等教育者的服装消费远大于其它人,即性别因素与受教育程度有交互作用,故将回归方程改进为

(5.1.24)

即添加一项(D1iD2i)以反映交互作用。

下面我们仍以表5.1.2资料为例介绍Chow检验。

设有n1组资料可以是多元,以及n2组资料(Y2i,X2i),X2i须与X1i维数相同,对它们分别建立回归模型:

(5.1.25)

(5.1.26)

Chow检验的目的是鉴别这两个模型究竟有无显著性差别。

它的步骤如下:

(1)合并这两组资料,建立一个统一模型:

(5.1.27)

算得残差平方和S,其自由度是n1+n2-m。

(2)分别计算两个单独模型的残差平方和S1(自由度n1-m)与S2(自由度n2-m)。

(3)令S3=S1+S2(自由度是n1+n2-2m),S4=S-S3(自由度是m),建立统计量

(5.1.28)

在两个单独的回归模型一致的假设下,统计量F应服从自由度为的F分布,在显著性水平α下,查得临界值,如果F超过了临界值,就在置信水平1-α下拒绝两个回归模型一致的假定。

Chow检验简便易于操作,但是结果比较粗糙。

如果拒绝了一致性假设,只知道两个模型存在显著性差异,可是到底是不一样,还是βi不一样,就不得而知了。

在表5.1.2资料中,算得

(5.1.29)

故拒绝两个单独模型一致的假定,即认为英国在战后恢复期与振兴期的居民储蓄与收入关系存在显著性差异。

下面以本段资料给出算例与计算程序及结果。

算例5.1.2分段回归与Chow检验

读者可以从打印出来的含虚拟变量数据具体体会虚拟变量的构造与作用,最后的拟合效果图(图5.1.2.1)清楚显示这个分段回归,是分两段直线段。

-------------------------------------------------------------------------------------------------------------------------

虚拟变量分段回归与Chow检验,例5.1.2.

例512.D数据文件中,n=18,m=1,N1=9

N1+N2=N,分段回归第二组资料的个数是9

要显示原始资料吗?

0=不显示,1=显示(0)

总的回归方程样本总数18

Y=-1.0821+.1178X1

总的残差平方和Q:

.5722自由度:

16

第一个回归方程样本总数9

Y=-.2663+.0470X1

第一个方程的残差平方和Q1:

.1397自由度:

7

第二个回归方程样本总数9

Y=-1.7501+.1504X1

第二个方程的残差平方和Q2:

.1931自由度:

现在作两个回归方程差异显著性Chow检验

请输入显著性水平a,通常取a=0.01,0.05,0.10,a=?

统计量:

5.0371临界值:

4.6001

显著,两个回归方程存在显著性差异

下面引进虚拟变量作回归

要打印重新构造的回归资料吗?

0=不打印,1=打印

(1)

打印重新构造的含有虚拟变量的回归数据

.36001.00008.80008.8000

.21001.00009.40009.4000

.08001.000010.000010.0000

.20001.000010.600010.6000

.10001.000011.000011.0000

.12001.000011.900011.9000

.41001.000012.700012.7000

.50001.000013.500013.5000

.43001.000014.300014.3000

.5900.000015.5000.0000

.9000.000016.7000.0000

.9500.000017.7000.0000

.8200.000018.6000.0000

1.0400.000019.7000.0000

1.5300.000021.1000.0000

1.9400.000022.8000.0000

1.7500.000023.9000.0000

1.9900.000025.2000.0000

打印使用虚拟变量的回归方程

Y=-1.7502+1.4839X1+.1505X2+-.1034X3

打印使用虚拟变量的回归分析结果

现在作线性回归显著性检验,计算t,F,R统计量

-----------------------------------------------------

线性回归分析计算结果

样本总数18自变量个数3

回归方程Y=b0+b1*X1+...+b3*X3

回归系数b0,b1,b2,..

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1