多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt

上传人:b****1 文档编号:1020477 上传时间:2022-10-15 格式:PPT 页数:49 大小:503.50KB
下载 相关 举报
多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt_第1页
第1页 / 共49页
多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt_第2页
第2页 / 共49页
多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt_第3页
第3页 / 共49页
多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt_第4页
第4页 / 共49页
多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt_第5页
第5页 / 共49页
点击查看更多>>
下载资源
资源描述

多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt

《多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt》由会员分享,可在线阅读,更多相关《多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt(49页珍藏版)》请在冰豆网上搜索。

多层次线性模型理论与实践运用统计方法讲座厦门大学.ppt

2022/10/15,1,多层线性模型理论与实践运用IntroductiontoHLM,厦门大学管理学院李海东2012年6月,感谢UniversityofMaryland的LiaoHui教授为本专题提供的资料与研究数据。

2022/10/15,2,什么是多层(多水平)数据?

多层(多水平)数据指的是观测数据在单位上具有嵌套的关系。

如员工嵌套于部门(或团队),部门嵌套于组织等。

同一单位内的观测,具有更大的相似性。

即:

来自于相同公司组织的员工,其填答的问卷数据彼此间的相似性要比不同公司组织间的员工相似性要高,因为他们受到相同公司组织的环境、情境或文化、氛围的影响。

如果这些相似性被忽略,以完全独立的角度进行回归分析,因变量无法被自变量所解释的部分通通被归到残差项中(包含了公司组织的某些属性特征)。

造成残差项的方差比真正误差项的方差要大!

2022/10/15,3,嵌套于背景(contextual,或情境)特征的多层数据举例,学生水平特征的观测,嵌套于班级或学校夫妻、兄弟姊妹特征的观测,嵌套于家庭个体之间的观测嵌套于社区个体不同时间点的重复测量嵌套于个体病人嵌套于医生(或医院)个体嵌套于公司组织,2022/10/15,4,对多层数据,我们了解什么.,随机选取两个观测,同一组内的观测之间的相似性要比不同组观测之间的相似性大;如果回归模型不能解释所有的组间的差异(事实上传统回归不可能做到这一点),那么同一组内的观测之间的误差可能相关;这就违背了传统回归(OLS)中关于残差相互独立的假设;至少,传统回归分析得到的标准误的估计不正确(太小)。

2022/10/15,5,HLM数据特点,对于嵌套数据,传统回归模型的做法:

(1)个体(如员工)水平上分析问题:

同一公司组织的员工间相互独立的假设是不合理的,同样对不同公司组织的员工和相同公司组织的员工作同一假设也是不合理的。

(2)组(如公司组织)水平上分析问题:

丢失了公司组织内员工个体间的差异的信息。

例如:

【心理安全氛围员工学习行为】,2022/10/15,6,多层次分析中的构念,个体层次构念(individuallevelconstruct)【OCB、绩效、创造力、工作满意度等】单位层次构念(unitlevelconstruct)1、共享单位特性构念(sharedunitpropertiesconstruct)【团队心理安全氛围、团队授权氛围、团队凝聚力、组织伦理氛围、团队边界管理等】2、总体单位特性构念(globalunitpropertiesconstruct)【组织规模、组织功能等】3、形态单位特性构念(configuralunitpropertiesconstruct)【组织人员的多元化或多样化】,2022/10/15,7,多层次模型研究的方法,1、多层次模型中各变量(或构念)的测量;2、研究设计(即构念具体置于哪一个层次)和调查取样设计;3、数据聚合;4、多层次数据分析。

2022/10/15,8,数据聚合(aggregation),2022/10/15,9,回归分析模型(regressionanalysis),被解释变量(因变量,效标变量),解释变量(自变量),在实证研究中,回归分析主要是运用在问卷调查或实验设计的数据分析之中。

2022/10/15,10,回归分析模型的假设,误差项彼此之间独立,且服从平均数为0,方差为常数的正态分析(independentandnormallydistributed)因变量Y的假设:

回归模式中的误差项假设或因变量的假设是非常严格的!

2022/10/15,11,独立性不满足带来的问题,传统回归系数估计的标准误依赖于相互独立的假设;如果独立性的假设不满足,得到的标准误的估计往往偏小,因此所犯第一类错误的概率往往偏大。

2022/10/15,12,回归模型中,如何解决残差相关的问题?

希望定义一个模型,可以明确地允许因变量水平在组内和组间存在差异例如,允许员工的工作绩效存在公司组织之间的差异,2022/10/15,13,告别OLS:

一个简单的多层线性模型,将重写为:

2022/10/15,14,一个简单的多层线性模型,指个体i在单元(比如群体、部门)j中的结果变量,截距,回归系数,个体i在单元j中的预测因子之值,单元j的残差项,个体i在单元j中的残差项,2022/10/15,15,uj表示什么?

定义第j组(第二水平)对于第j组的所有观测都相同只有下标j,没有下标i解释:

总截距和第j组的截距之间的差异,2022/10/15,16,rij表示什么?

残差项定义第j组第i个观测均值为0,2022/10/15,17,模型的特征,注意到:

ij=uj+rij我们有:

Var(ij)=Var(uj+rij)=Var(uj)+Var(rij)+2*Cov(uj,rij)=Var(uj)+Var(rij),2022/10/15,18,多层线性模型,Level-1(如:

员工)Level-2(如:

公司),自变量可以有多个,回归式中的截距项与斜率项均有下标j,表明各个分析单元内的自变量与因变量之间的关系是不一样的。

每个分析单元自行生成一条回归方程式,有自己的斜率与截距。

阶层线性模型与一般回归式的差别在于因变量在组间是存在差异的(统计上是显著的)。

运用单因素方差分析即可判断各组间的因变量是否都同质。

在阶层线性模型中,设置零模型、虚无模型或无条件模型(nullmodel、emptymodel、unconditionalmodel)进行判定组间变异。

2022/10/15,19,多层线性模型,合并模型:

2022/10/15,20,多层线性模型零模型,Level-1:

Level-2:

固定效应Fixedeffect,随机效应randomeffect,组间方差(level-2)+组内方差(level-1)。

透过level-1的自变量与level-2的自变量对因变量的变异进行解释。

2022/10/15,21,多层线性模型,运用HLM的时机:

因变量在组间具有显著的差异时,即组间是异质的。

判断方法:

组内相关系数(IntraclassCorrelationCoefficient,ICC

(1)计算公式:

判断准则:

低度关联强度,中度关联强度,高度关联强度,当ICC

(1)0.059时,即表明造成因变量的组间变异不可以忽略,因变量在组间的分布是不太一样的。

2022/10/15,22,HLM常用模型类型,

(一)具有随机效应的单因素方差分析模型(one-wayAnovawithRandomEffect)【零模型】level-1:

level-2:

合并模型:

2022/10/15,23,HLM常用模型类型,

(二)具随机效应单因素协方差分析模型(One-wayANCOVAwithRandomEffects)level-1:

level-2:

协方差分析主要是透过统计控制的方式,将影响因变量的其他自变量加以控制,且作为回归分析的自变量排除其对因变量的影响,比较各组间平均数的差异。

这里提到的协方差就是对因变量能够产生影响的自变量。

(将协方差放入模型之中,主要是作为统计控制之用),在level-2中,未考虑任何的自变量或总体层次的数据,但考虑了组间的差异。

将level-1中的斜率项视为各组之间相等,即固定效应,因此,在level-2中的假设检验中,就是检验这个共同斜率是否为0.,2022/10/15,24,HLM常用模型类型,一般的线性回归模型:

不考虑各组回归线的差异(各组同质)【又称混合回归(pooledregression)Level-1:

Level-2:

2022/10/15,25,HLM常用模型类型,(三)以平均数为结果的回归模型Level-1:

Level-2:

截距项就是各组因变量的平均数,2022/10/15,26,HLM常用模型类型,(四)随机系数回归模型(Random-CoefficientsRegressionModel)Level-1:

Level-2:

2022/10/15,27,HLM常用模型类型,(五)以截距和斜率为结果的回归模型Level-1:

Level-2:

2022/10/15,28,HLM模型的参数检验,HLM模型的参数检验主要是针对固定效应的回归系数以及随机效应的方差进行检验。

2022/10/15,29,关于HLM的一些重要议题,1、level-1预测变量的中心化议题(centering)

(1)不中心化(rawmetric)

(2)以组平均为基准的中心化(groupmean)(3)以总平均为基准的中心化(grandmean)2、level-2预测变量的中心化

(1)不中心化(rawmetric)

(2)以总平均为基准的中心化(grandmean)3、在多元回归分析中,变量的中心化可以减少自变量之间的多重共线性问题。

此外,中心化还有利于对回归线的截距项做出有意义的解释。

2022/10/15,30,关于HLM的一些重要议题,4、考虑到跨层次交互作用的模式,对自变量不做中心化处理与以总平均数为基准的中心化结果是等同的(Hofmann&Gavin,1998)。

5、在配适随机斜率模型时,最好不要采用以组平均数为基准的中心化变量,除非有清楚的理论,说明相对分数与因变量相关(即将各组平均数纳入分析模式之中)(Kreft,Leeuw,&Aiken,1995;Snijders&Bosker,1999;Raudenbush&Bryk,2002)。

2022/10/15,31,关于HLM的一些重要议题,6、Level-2回归系数的固定效应与随机效应的选择【从理论出发,在实证研究上可以先行测试是否存在随机效应】具体建议:

(1)当组数小于10时,建议采用固定效应模型;

(2)以抽样推回总体时,建议采用随机系数模型;(3)每一组样本数都过小时,建议采用随机系数模型;7、样本大小的决定,2022/10/15,32,HLM应用举例,文章:

Hofmann,D.A.1997.Anoverviewofthelogicandrationaleofhierarchicallinearmodels.JournalofManagement,23(6):

723-744.研究假设:

H1:

个体的情绪(mood)与其帮助行为(helpingbehavior)正向相关;【level-1】H2:

在控制个体的情绪之后,群体凝聚力(proximity,邻近)对个体帮助行为具有正向影响【level-2】H3:

群体凝聚力在个体情绪与其帮助行为之间起到跨层次调节作用。

【正向】,2022/10/15,33,HLM应用举例,运用HLM检验假设的几个前提条件:

1、因变量(即帮助行为)在具有显著的组间变异(groupvariance);2、level-1的斜率显著(检验H1);3、level-1的截距项在不同群组间有显著的变异(检验H2);4、level-1的斜率项在不同群组间有显著的变异(检验H3);5、level-1截距项的变异与level-2预测变量显著相关;6、level-1斜率项的变异与level-2预测变量显著相关。

2022/10/15,34,HLM应用举例,Level-1.sav和Level-2.sav【数据准备】在level-1.sav的数据文件中,有1000个观测样本和两个第一水平的变量(不包含第二水平指标变量:

组别编号ID),这两个变量分别是helping和mood在level-2.sav的数据文件中,有50个群体,两个群体层次变量ave_mood和proximity。

2022/10/15,35,HLM应用举例,第一步:

建立零模型(nullmodel)Level-1:

Level-2:

2022/10/15,36,HLM应用举例,计算结果,2022/10/15,37,HLM应用举例,第二步:

建立随机系数回归模型Level-1:

Level-2:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 党团建设

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1