第八章虚拟变量回归dayin.ppt

上传人:b****3 文档编号:2710321 上传时间:2022-11-08 格式:PPT 页数:35 大小:1MB
下载 相关 举报
第八章虚拟变量回归dayin.ppt_第1页
第1页 / 共35页
第八章虚拟变量回归dayin.ppt_第2页
第2页 / 共35页
第八章虚拟变量回归dayin.ppt_第3页
第3页 / 共35页
第八章虚拟变量回归dayin.ppt_第4页
第4页 / 共35页
第八章虚拟变量回归dayin.ppt_第5页
第5页 / 共35页
点击查看更多>>
下载资源
资源描述

第八章虚拟变量回归dayin.ppt

《第八章虚拟变量回归dayin.ppt》由会员分享,可在线阅读,更多相关《第八章虚拟变量回归dayin.ppt(35页珍藏版)》请在冰豆网上搜索。

第八章虚拟变量回归dayin.ppt

1在影响房地产价格的众多因素中,有在影响房地产价格的众多因素中,有定量的因素定量的因素:

成本因素、房地产供求因素、经济因素、人口因素成本因素、房地产供求因素、经济因素、人口因素等;等;也有也有定性的因素定性的因素:

社会因素、行政因素、区位因素、个别因素、投机因社会因素、行政因素、区位因素、个别因素、投机因素、素、自然因素自然因素等。

等。

在研究房地产价格影响机理时,需要分析那些不易量化在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。

的定性因素对房地产价格是否真的有显著影响。

能否把定性的因素也引入计量经济模型中呢能否把定性的因素也引入计量经济模型中呢?

怎样才能怎样才能在模型中有效地表示这些定性因素的作用呢?

在模型中有效地表示这些定性因素的作用呢?

引子引子2男女大学生的消费真的有差异男女大学生的消费真的有差异吗吗?

当代大学生在消费结构呈现出多元化趋势。

大学生除了日当代大学生在消费结构呈现出多元化趋势。

大学生除了日常生常生活费开支以外,还有人际交往、网络通讯、书报、衣着、活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆化妆品、电脑、旅游、食品、学习用品、各种考证等消费。

不品、电脑、旅游、食品、学习用品、各种考证等消费。

不同性同性别大学生的消费结构有所不同,专科生、本科生、研究生别大学生的消费结构有所不同,专科生、本科生、研究生的消的消费结构更有差异。

不同年级之间,男女同学之间,消费水费结构更有差异。

不同年级之间,男女同学之间,消费水平、平、消费结构、消费方式上都存在着差异。

消费结构、消费方式上都存在着差异。

(注:

来源于新华网等:

共青团中央、全国学联共同发布的(注:

来源于新华网等:

共青团中央、全国学联共同发布的中国大学生中国大学生消费与生活形态研究报告消费与生活形态研究报告)为了研究为了研究男女男女大学生、大学生、不同层次不同层次大学生、大学生、不同年级不同年级大学生大学生的消的消费结构是否有差异,需要将这些定性的因素引入计量模型,费结构是否有差异,需要将这些定性的因素引入计量模型,怎怎样才能在模型中有效地表示这类定性因素的作用呢?

样才能在模型中有效地表示这类定性因素的作用呢?

2第一节第一节虚拟变量虚拟变量一、什么是虚拟变量一、什么是虚拟变量3数量变量与属性变量数量变量与属性变量可用数量表现的连续变量可用数量表现的连续变量只表明属性的不连续变量只表明属性的不连续变量属性变量:

属性变量:

不能精确计量的说明某种属性或状态的定不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件性变量,如性别、民族、战争、政治事件本身是定性的二分类变量本身是定性的二分类变量(非此即彼非此即彼)本来是连续变量也可转换为定性变量本来是连续变量也可转换为定性变量(如上线如上线/不上线不上线)虚拟变量:

虚拟变量:

人工构造的取值为人工构造的取值为0和和1的作为属性变量代的作为属性变量代表的变量称虚拟变量,一般常用表的变量称虚拟变量,一般常用D(dummy)表示表示D=0D=0表示某种属性或状态不出现或不存在表示某种属性或状态不出现或不存在D=1D=1表示某种属性或状态出现或存在表示某种属性或状态出现或存在虚拟变量的作用虚拟变量的作用作为属性因素的代表,如作为属性因素的代表,如性别性别作为某些非精确计量的数量因素的代表,作为某些非精确计量的数量因素的代表,如如受教育程度受教育程度(高中及以下、专科、本科及以上)高中及以下、专科、本科及以上)作为某些偶然因素或政策因素的代表,作为某些偶然因素或政策因素的代表,如如伊拉克战争、伊拉克战争、“911911事件事件”、四川汶川大地震、四川汶川大地震时间序列分析中作为季节(月份)的代表时间序列分析中作为季节(月份)的代表分段回归分段回归研究斜率、截距的变动研究斜率、截距的变动比较两个回归模型的差异比较两个回归模型的差异虚拟被解释变量模型:

虚拟被解释变量模型:

被解释变量本身是定性变量被解释变量本身是定性变量4二、虚拟变量模型二、虚拟变量模型虚拟变量模型虚拟变量模型:

包含有虚拟变量的模型称虚拟变量模型包含有虚拟变量的模型称虚拟变量模型三种类型:

三种类型:

1、解释变量中只包含虚拟变量解释变量中只包含虚拟变量作用:

作用:

假定其他因素都不变,只研究某种定性因素在某定假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异量变量上是否表现出显著差异(只论有无显著差异,不论差异的原因只论有无显著差异,不论差异的原因)2、解释变量中既含定量变量,又含虚拟变量解释变量中既含定量变量,又含虚拟变量作用:

作用:

研究定量变量和虚拟变量同时对被解释变量的影响研究定量变量和虚拟变量同时对被解释变量的影响3、虚拟被解释变量模型:

被解释变量本身取值为虚拟被解释变量模型:

被解释变量本身取值为0或或1作用:

作用:

对某社会经济现象进行对某社会经济现象进行“是是”与与“否否”判断研究判断研究(离散选择模型)(离散选择模型)5三、虚拟变量的设置规则三、虚拟变量的设置规则1、虚拟变量取值、虚拟变量取值虚虚拟拟变变量量D取取值值为为0,还还是是取取值值为为1,要要根根据据研研究究的的目目的的去决定去决定D取值为取值为0的类型的类型基础类型,基础类型,作为比较的基准作为比较的基准D取值为取值为1的类型的类型与基础类型相比较的类型与基础类型相比较的类型例如:

例如:

D=0如果是女性如果是女性(基础类型)(基础类型)D=1如果是男性如果是男性(比较类型(比较类型)D=0为为“911事件事件”以前以前(基础类型)(基础类型)D=1为为“911事件事件”以后以后(比较类型(比较类型)D=0不是大学毕业生不是大学毕业生(基础类型)(基础类型)D=1是大学毕业生是大学毕业生(比较类型(比较类型)67虚拟变量的设置规则虚拟变量的设置规则和和取值均为取值均为0的类型的类型基础类型:

基础类型:

是比较的基准,是比较的基准,代表了基准组代表了基准组(西部地区)(西部地区)的截距的截距或或分别取值为分别取值为1的类型的类型是是与基础类型比较的类型与基础类型比较的类型和和为差异截距系数为差异截距系数为东部地区为东部地区为中部地区为中部地区为其他为其他为其他为其他又如,研究东、中、西部地区收入又如,研究东、中、西部地区收入X与消费支出与消费支出Y的关系的关系:

8

(1)

(1)在有截距的模型中在有截距的模型中如果模型中每个定性因素有如果模型中每个定性因素有mm个相互排斥的类型,模型中个相互排斥的类型,模型中只能引入只能引入m-1m-1个虚拟变量,否则会出现完全多重共线性个虚拟变量,否则会出现完全多重共线性例如:

一个定性因素有三种类型,若设三个虚拟变量例如:

一个定性因素有三种类型,若设三个虚拟变量若若;若若,等等。

,等等。

显然此时显然此时,而截距,而截距对应对应的变量为的变量为1,再次生成了截再次生成了截距项,则导致了距项,则导致了完全的完全的多重共线性多重共线性2、避免落入、避免落入“虚拟变量陷阱虚拟变量陷阱”9模型为模型为此时虽然有此时虽然有,若,若,若若,且,且,但因为没有,但因为没有截距项,不会出现完全的多重共线性。

截距项,不会出现完全的多重共线性。

注意注意:

此时此时等参数不再是差异截距系数,等参数不再是差异截距系数,而分别是相应类型的截距。

而分别是相应类型的截距。

(2)若若模型中无截距项模型中无截距项第二节第二节虚拟解释变量回归虚拟解释变量回归定性变量作为解释变量,可以影响模型的截距,也可以影定性变量作为解释变量,可以影响模型的截距,也可以影响模型的斜率,还可以同时影响截距和斜率响模型的斜率,还可以同时影响截距和斜率只只使使截距变动截距变动只使斜率变动只使斜率变动使截距与斜率都变动使截距与斜率都变动一、用虚拟变量表示不同截矩的回归一、用虚拟变量表示不同截矩的回归加法类型加法类型虚拟变量以加法方式引入模型的作用:

改变模型中截距,虚拟变量以加法方式引入模型的作用:

改变模型中截距,可分为各种情况去设置虚拟变量可分为各种情况去设置虚拟变量10111.1.解解释释变变量量只只有有一一个个分分为为两两种种类类型型的的定定性性变变量量无无定量变量的回归定量变量的回归这种模型又称方差分析模型这种模型又称方差分析模型其中:

为公立学校教师工资,其中:

为公立学校教师工资,=0为农村学校;为农村学校;D=1为城镇学校为城镇学校分析条件期望:

分析条件期望:

基础类型:

基础类型:

比较类型:

比较类型:

为差异截距系数,通过对系数为差异截距系数,通过对系数的的t检验:

可检验检验:

可检验在其他因素不变的条件下,城乡教师的工资是否有显著在其他因素不变的条件下,城乡教师的工资是否有显著差别差别112、解解释释变变量量包包含含一一个个定定量量变变量量和和一一个个分分为为两两种类型的定性变量的回归种类型的定性变量的回归例如:

为服装消费例如:

为服装消费为收入,为收入,=0为男性为男性D=1为女性为女性分析条件期望:

分析条件期望:

基础类型:

基础类型:

比较类型:

比较类型:

为差异截距系数为差异截距系数对对系系数数的的t检检验验:

可可检检验验定定性性因因素素对对截截距距是是否否有有显显著影响著影响注意:

注意:

应服从基本假定应服从基本假定这这里里一一个个定定性性变变量量具具有有两两种种类类型型,只只使使用用了了一一个个虚虚拟拟变量(为什么?

)变量(为什么?

)12例如例如其中:

其中:

年工资年工资工龄工龄D=1大学毕业及以上大学毕业及以上D=0其他(非大学毕业)其他(非大学毕业)非大学毕业(基准类型)非大学毕业(基准类型)大学毕业及以上大学毕业及以上133、解解释释变变量量包包含含一一个个定定量量变变量量和和一一个个两两种种以以上上类类型的定性变量的回归型的定性变量的回归类型:

高中以下、高中毕业、大学毕业及以上类型:

高中以下、高中毕业、大学毕业及以上三种类型三种类型模型模型例如例如年工资年工资工龄工龄=1只是高中毕业只是高中毕业=1大学毕业及以上大学毕业及以上=0其他其他=0其他其他基础类型:

基础类型:

(高中以下)(高中以下)比较类型:

比较类型:

(高中)(高中)(大学及以上)(大学及以上)差异截距系数为差异截距系数为和和问题:

如果还要区分问题:

如果还要区分“专科专科”“本科本科”、“硕士硕士”、“博士博士”应怎么办?

应怎么办?

14注意:

注意:

应服从基本假定应服从基本假定一个定性变量有三种类型,使用了两个虚拟变量,一个定性变量有三种类型,使用了两个虚拟变量,和和代表的是同一个定性变量的两种不同类型代表的是同一个定性变量的两种不同类型两两个个差差异异截截距距系系数数和和表表示示的的都都是是与与基基础础类类型型的差异的差异一一个个定定性性变变量量有有多多种种类类型型时时,虚虚拟拟变变量量可可同同时时取取值值为为0,但但不不能能同同时时取取值值为为1,因因同同一一定定性性变变量量的的各各类类型间型间“非此即彼非此即彼”154、解释变量包含一个定量变量和两个定性变量、解释变量包含一个定量变量和两个定性变量模型模型这里的这里的和和代表的是两个不同的定性变量代表的是两个不同的定性变量,各分为两种类型各分为两种类型例如:

为文化支出,为收入例如:

为文化支出,为收入用用t检检验验分分别别检检验验和和的的统统计计显显著著性性:

验验证证两两个个定定性性变变量量对截距是否有显著影响对截距是否有显著影响高中及以上文化程度高中及以上文化程度农村居民农村居民城镇居民城镇居民高中以下文化程度高中以下文化程度16对比类型:

对比类型:

基础类型:

基础类型:

注意:

注意:

应服从基本假定应服从基本假定两个定性变量分别有两种类型,用了两个虚拟变量两个定性变量分别有两种类型,用了两个虚拟变量(为什么?

)(为什么?

)两个定性变量和一个定性变量三种类型都用了两个虚两个定性变量和一个定性变量三种类型都用了两个虚拟变

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电子电路

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1