1、虚 拟 变 量虚 拟 变 量北京大学教育经济与管理系:教育统计与SPSS应用线性回归的作用?用变量的观测数据拟合所关注的变量和影响其变化的变量之间的线性关系式响其变化的变量之间的线性关系式?检验影响变量的显著程度?比较影响变量的作用大小?用一个或多个变量的变化解释和预测另一?用一个或多个变量的变化解释和预测另一个变量的变化北京大学教育经济与管理系:教育统计与SPSS应用线性回归的类型?一元线性回归,针对一个影响变量(自变量)的回归分析(自变量)的回归分析?多元线性回归,针对多个影响变量(自变量)的回归分析北京大学教育经济与管理系:教育统计与SPSS应用回归方程?一元线性回归YABX?多元线性回
2、归多元线性回归YB0B1X1B2X2 BnXn 北京大学教育经济与管理系:教育统计与SPSS应用线性回归中变量的测量尺度?因变量(Y):定距变量?自变量(X):定类、定序变量或定?自变量(X):定类、定序变量或定距变量,对于分类变量需要转换成虚拟变量拟变量北京大学教育经济与管理系:教育统计与SPSS应用线性回归的位置线性回归的位置北京大学教育经济与管理系:教育统计与SPSS应用一元线性回归线北京大学教育经济与管理系:教育统计与SPSS应用例例1对受访者的性别和月收入进行一元线性回归分析一元线性回归分析北京大学教育经济与管理系:教育统计与SPSS应用注意注意当自变量是分类变量时当自变量是分类变量
3、时,需要将原需要将原当自变量是分类变量时当自变量是分类变量时,需要将原需要将原变量转换成虚拟变量,所有虚拟变量都变量转换成虚拟变量,所有虚拟变量都是是“1”和和“0”取值的二分变量取值的二分变量。是是“1 和和“0 取值的二分变量取值的二分变量。当原变量是二分类变量时,我们只需要设定一个“1”、“0”取值的虚拟变量,并且把取值为“0”的那个类别作为参照项且把取值为“的那个类别作为参照项北京大学教育经济与管理系:教育统计与SPSS应用步骤1:点击“Recode”,弹出对话框通常选择Recode into Different Variable北京大学教育经济与管理系:教育统计与SPSS应用步骤2:
4、将“性别”变量移到中间空白框北京大学教育经济与管理系:教育统计与SPSS应用步骤3:在Name栏中填写虚拟变量名北京大学教育经济与管理系:教育统计与SPSS应用步骤4:点击“Change”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤5:点击“Old and New Values”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤6:将原变量的“1”设为新变量的“1”北京大学教育经济与管理系:教育统计与SPSS应用步骤7:将原变量的“2”设为新变量的“0”北京大学教育经济与管理系:教育统计与SPSS应用步骤8:点击“Continue”,回到主对话框北京大学教育经济与管理系:教育
5、统计与SPSS应用步骤8:点击“OK”,生成新的虚拟性别变量北京大学教育经济与管理系:教育统计与SPSS应用在设置完虚拟变量后在设置完虚拟变量后,我们才我们才在设置完虚拟变量后在设置完虚拟变量后,我们才我们才能正式开始回归分析。能正式开始回归分析。北京大学教育经济与管理系:教育统计与SPSS应用步骤:点击“中的“,弹出对话框步骤9:点击“Regression”中的“Linear”,弹出对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤10:选择因变量“月收入”和自变量“性别”别”北京大学教育经济与管理系:教育统计与SPSS应用点击“OK”,结果一:确定系数表北京大学教育经济与管理系:教
6、育统计与SPSS应用结果一告诉我们什么??表格中的R、R Square和Adjusted R Square都是用于表示模型的解释能力于表示模型的解释能力?通常选择Adjusted R Square作为我们的结论依据,调整后的 平方越大,说明性别和收入的线性关调整后的R平方越大,说明性别和收入的线性关系越强,即性别对收入的解释力越强?表中调整后的R平方0.033,表示性别能够解释收入3.3的变化北京大学教育经济与管理系:教育统计与SPSS应用结果二:方差分析表结果二:方差分析表北京大学教育经济与管理系:教育统计与SPSS应用结果二告诉我们什么?结果二是对回归方程进行显著度检验的方?结果二是对回归
7、方程进行显著度检验的方差分析,即判断总体回归系数中至少有一个不等于个不等于0?表中显著度(Sig)0 001,表明性别与收?表中显著度(Sig)0.001,表明性别与收入之间具有显著的线性关系。北京大学教育经济与管理系:教育统计与SPSS应用结果三:回归系数表结果三:回归系数表北京大学教育经济与管理系:教育统计与SPSS应用结果三告诉我们什么??与结果一中的确定系数不同,回归系数是回归方程中x的斜率,表示x每变化一个单位,y的平均程中 的斜率,表示 每变化一个单位,y的平均变化。?从表中B135 406,可以发现男性比女性的平均?从表中B135.406,可以发现男性比女性的平均月收入多135.
8、406元(由于在设定虚拟变量时,将女性取值为“,因此这里以女性为参照项)。女性取值为“0”,因此这里以女性为参照项)。?由此我们可以得到回归方程:y396.656135.406X北京大学教育经济与管理系:教育统计与SPSS应用结果三告诉我们什么??表中的t检验是针对回归系数的显著度检验,而结果二中的方差分析是对整个回归方程的检验,在果二中的方差分析是对整个回归方程的检验,在一元回归分析中,这两种检验结果是等同的。而在多元回归分析中,则有可能是不同的。整体方在多元回归分析中,则有可能是不同的。整体方程的显著并不意味着每个回归系数都显著,但每个系数的显著一定意味着整体方程是显著的。个系数的显著一定
9、意味着整体方程是显著的。?从表中显著度0.001,可以发现性别对收入的影响是非常显著的。响是非常显著的。北京大学教育经济与管理系:教育统计与SPSS应用多元线性回归线北京大学教育经济与管理系:教育统计与SPSS应用实例实例2将受访者的性别、教育程度(四分类的教育程度:小学、初中、(四分类的教育程度:小学、初中、高中、大专及以上)和年龄作为自变量,通过多元线性回归,分析其对月收通过多元线性回归,分析其对月收入的影响。入的影响。小学=1、初中=2、高中=3、大专及以上=4北京大学教育经济与管理系:教育统计与SPSS应用小学 1、初中 2、高中 3、大专及以上 4由于例题中的教育变量是个由于例题中的
10、教育变量是个四分类四分类的定的定由于例题中的教育变量是个由于例题中的教育变量是个四分类四分类的定的定序变量,因此我们需要设置序变量,因此我们需要设置三个三个“1”、“、“0”取值的虚拟教育变量取值的虚拟教育变量:edu1、edu2和和edu3,取值的虚拟教育变量取值的虚拟教育变量:edu1、edu2和和edu3,分别用来表示“小学”、“初中”和“高分别用来表示“小学”、“初中”和“高中中”,将将“大专及以上大专及以上”教育类别作为参照教育类别作为参照中中”,将将“大专及以上大专及以上”教育类别作为参照教育类别作为参照项项,其余三个类别分别与其进行比较。,其余三个类别分别与其进行比较。北京大学教
11、育经济与管理系:教育统计与SPSS应用步骤1:点击“Recode”,弹出对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤2:将四分类的教育变量拖入中间空白框北京大学教育经济与管理系:教育统计与SPSS应用步骤:在栏中填写第一个虚拟变量步骤3:在Name栏中填写第一个虚拟变量edu1北京大学教育经济与管理系:教育统计与SPSS应用步骤4:在Label栏中填写变量名标签小学北京大学教育经济与管理系:教育统计与SPSS应用步骤5:点击“Change”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤6:点击“Old and New Values”按钮北京大学教育经济与管理系:教育统计
12、与SPSS应用步骤:将原变量中表示小学的“设为新变量的“步骤7:将原变量中表示小学的“1”设为新变量的“1”北京大学教育经济与管理系:教育统计与SPSS应用步骤8:将原变量的其余取值都设为“0”北京大学教育经济与管理系:教育统计与SPSS应用步骤9:点击“Continue”,回到主对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤:点击“,生成表示小学的虚拟变量步骤10:点击“OK”,生成表示小学的虚拟变量edu1北京大学教育经济与管理系:教育统计与SPSS应用步骤11:重新点击“Recode”,弹出对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤12:将四分类的教育变量拖入
13、中间空白框北京大学教育经济与管理系:教育统计与SPSS应用步骤:在栏中填写第二个虚拟变量步骤13:在Name栏中填写第二个虚拟变量edu2北京大学教育经济与管理系:教育统计与SPSS应用步骤14:在Label栏中填写变量名标签初中北京大学教育经济与管理系:教育统计与SPSS应用步骤15:点击“Change”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤16:点击“Old and New Values”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤17:将原变量中代表初中的“2”设为新变量的“1”步骤17:将原变量中代表初中的“2”设为新变量的“1”北京大学教育经济与管理系:
14、教育统计与SPSS应用步骤18:将原变量的其余取值都设为“0”北京大学教育经济与管理系:教育统计与SPSS应用步骤19:点击“Continue”,回到主对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤:点击“,生成表示初中的虚拟变量步骤20:点击“OK”,生成表示初中的虚拟变量edu2北京大学教育经济与管理系:教育统计与SPSS应用步骤21:重新点击“Recode”,弹出对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤22:将四分类的教育变量拖入中间空白框北京大学教育经济与管理系:教育统计与SPSS应用步骤:在栏中填写第二个虚拟变量步骤23:在Name栏中填写第二个虚拟变量
15、edu3北京大学教育经济与管理系:教育统计与SPSS应用步骤24:在Label栏中填写变量名标签高中北京大学教育经济与管理系:教育统计与SPSS应用步骤25:点击“Change”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤26:点击“Old and New Values”按钮北京大学教育经济与管理系:教育统计与SPSS应用步骤:将原变量中代表高中的“设为新变量的步骤27:将原变量中代表高中的“3”设为新变量的“1”北京大学教育经济与管理系:教育统计与SPSS应用步骤28:将原变量的其余取值都设为“0”北京大学教育经济与管理系:教育统计与SPSS应用步骤29:点击“Continue”
16、,回到主对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤:点击“,生成表示高中的虚拟变量步骤30:点击“OK”,生成表示高中的虚拟变量edu3北京大学教育经济与管理系:教育统计与SPSS应用步骤:点击“中的“,弹出对话框步骤31:点击“Regression”中的“Linear”,弹出对话框北京大学教育经济与管理系:教育统计与SPSS应用步骤32:选择因变量“月收入”北京大学教育经济与管理系:教育统计与SPSS应用步骤32:选择自变量“虚拟性别”,“edu1”,“edu2”,“edu3”和年龄北京大学教育经济与管理系:教育统计与SPSS应用点击“OK”,结果一:确定系数表北京大学教育经济与管理系:教育统计与SPSS应用结果一告诉我们什么?结果告诉我们什么?表中调整后的 平方,表示整?表中调整后的R平方0.044,表示整个方程能够解释收入变化的4.4。个方程能够解释收入变化的4.4。?与例1中的确定系数相比,提高了1.1个百分点。个百分点。北京大学教育经济与管理系:教育统计与SPSS应用结果二:方差分析表结果二:方差分析表北京大学教育经济与管理系:教育统计与SPSS应用结果二告诉
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1