社会期望性回答.docx
《社会期望性回答.docx》由会员分享,可在线阅读,更多相关《社会期望性回答.docx(5页珍藏版)》请在冰豆网上搜索。
社会期望性回答
第一节社会期望性回答
这是应答偏差中研究得最多的一个领域。
社会期望性回答(SociallyDesirableResponding,SDR)是指受试总倾向于给出一个使其显示出良好形像的回答。
早在50多年以前,心理测量学家就已提出SDR对于问卷效度影响的间题。
在40年代,Meehl和HatawayH注了八种用以测定自评量表中SDR的工具。
50年代以来,在人格、病理心理、态度以及敏感行为的自陈性测评中,SDR一直是个引人注目的突出问题。
以下的一节中回顾一下SDR在不同情况下的控制方法。
即或在一些情形下SDR无从控制,但也还是可以测量的,因此,再接下去是就已有的较好的SDR测评工具进行简介。
SDR效应的控制
既有的控制SDR的方法相当繁杂多样,这里只能作一简单归纳,讨论四种最有代表性的方法:
1.理性法(RationalTechnigues)。
这是控制自陈工具的构成特征,其目的是防止受试者以社会所期望的方式给出答案。
比如:
可以采用在社会期望程度上等同的两个陈述要求受试必选其一。
如果使用一个陈述,则可用从社会期望性角度来看是中性的陈述。
另外,还可选择内容饱和度高的陈述,也就是说,使内容的份量超出社会期望影响。
2.因子分析技术。
可在量表建构时采用,即选取在有关因子上负荷最高的条目。
如果某个主因子可能是代表SDR,那么可在因子旋转分析之前予以剔除。
还有一个更好的办法,如果SDR和内容条目一起评定,可将SDR归于第一因子,无论采用上述哪种技术,其余因子上负荷最高的条目所反映的就是除外SDR影响后的个体差异,因此,这些条目可用以组成没有SDR效应的测评工具。
3.协变量技术(covariatetechnigues)。
这种方法不是试图防止受试作出社会期望性的回答,而是在测定有关内容变量的同时测定SDR,本章末将有一个工具可为示例。
另外,为了提高分数的效度,可将粗分用一个相当SDR影响的量加以校正,从而残余部分则为校正了SDR后的测量变量分。
在MMPI计分中,系统地采用了这一方法,其中某些临床量表分都用测定SDR的K量表加以校正。
16PF中一些量表的评分现在也采用了类似的方法。
4.减少情境压力:
这是一类形式广泛的控制SDR的技术,包括各种减少情境中造成社会期望性回答的压力的方法,或许最简明的一个办法是向受试确保保密性,如果测试在教室进行,以下措施可使受试感受到更高的保密性:
1)使受试之间保持一定距离(尤其是熟人之间);2)要求务必不要在答卷上做任何识别记号;3)事先讲好答完后将答卷封在信封里并在出门时放人一个专门的箱子里。
或许是因为保密性的缘故,邮寄问卷调查中SDR的问题似乎不是那么突出。
有时需要对两次或更多次评定结果进行比较,这种情况可让受试填上自己的生日或在所有评定时用同一假名。
不过,即使采取这些措施,不少受试仍旧怀疑会有人搞清他们的真实身份。
还有一个更为大胆的办法叫做“虚拟通灵器”(boguspipeline),实质上也就是一个假测谎器。
让受试者与一台仪器相联,主试者声称可以通过测量其生理指标了解他们的态度,这样,仪器就被称为心灵的通路。
要求受试者猜测机器对每一个态度间题所读出的答案,用以作为检测其自知力的一个测验。
这个设计的思路是,受试会尽力避免被机器搞得窘迫不堪,因此,其所给出的答复较之一般的自评结果受到SDR的影响会小一些。
这一技术在一些调查中被证实有效,能提高对某些敏感问题的检出率。
包括:
种族主义的态度,性别歧视的态度,自相矛盾的态度,对残疾人联盟的厌恶,对测试内容的答案事先知道与否等情况。
还有一些技术是虚拟通灵器的变种,不过在形式上相对温和一些。
例如,在答卷前提醒受试,测量问题中有一些题目是专门测查伪装性。
更为复杂一点的一项做法是,给受试一份很容易识别的测谎量表,并予以评分,然后告诉受试其所得分是否存在着做假。
在当面调查中控制SDR的一个有用的技术是随机化回答法(RandomizedResponseMethod),与社会期望相关的问题(如:
你曾做过人工流产吗?
)与一些无关痛痒的问题(如:
你母亲是蓝眼睛吗?
)穿插在一起。
告诉受试通过掷硬币来确定回答哪些问题(不用告诉检查者掷硬币的结果),例如:
正面则回答第1个问题,若硬币为反面则回答第2个问题。
因为检查者不知道受试回答哪些间题,受试所感受到的要按社会期望回答问题的压力会小一些。
然而,通过三组统计数字最终还是可以估计出样本中的流产率:
①调查中得到肯定回答的比例,②假定有50%受试回答了这个问题,③人群中已知的蓝眼睛所占比例。
大部分证据提示随机化回答技术确实能提高敏感行为的检出率,不过仍未达到与实际数字相符的程度。
此外,有些研究者通过调查知情代理人的办法来减少SDR影响,调查时不找本人,而是询间对其十分熟悉的人来了解拟调查的行为。
根据Sudam等人收集到的资料,这一技术在测评可观察到的外部行为上效果令人满意,但对于测评态度则不然。
有关它在人格测量中的作用所得出的结果成败各半。
5.最后一类是最大限度地降低应激,也就是减低测评时的紧张。
已知能增加社会期望性回答的因素有:
(a)快速的指导语;(b)情绪的唤起;(c)注意力分散。
因此,应尽量将这些因素控制到最低限度。
SDR的测量
在研究当中有不少理由需要用到本章所涉及的SDR的评定工具。
最常见的一个用处是支持量表内容的区分效度。
为了保证量表的内容没有混杂SDR,研究者对同一样本应同时给出这两套评定,以期两者间不存在明显的相关,在上面谈到的协变量和目标旋转技术时也要运用SDR的测定。
在有些情况下,SDR不是用于校正得分的偏差,而是用以作为一个分数是否可信的取舍标准。
如果同时给予的SDR评定工具表明被试SDR很高,那么其答卷便可舍弃。
可以取一个恰当的划界分以检出那些假装好人或假装坏人的受试。
有了这样一个划界分便可以评价一个量表的内容虚假作答的可能性,如果在可能伪装好人的指导语下,SDR分表得分超过划界分,而量表其他实质变量的得分未变,则说明量表的内容能够抵制SDR的影响。
值得注意的一点是,发现某个人在一个量表中能够装好人并不证明量表在通常情况下混杂有SDR。
并且,伪装好人可以是一种个人特质或癖好。
情境性压力也可以用SDR测定工具评估,曾有一些研究者用SDR评定表研究过不同情境下SDR表现的程度。
SDR评定表还可以用以确定最佳检查者和最佳测查环境的特点,以期使受试达到最大可能的自我坦露。
在实际工作中,SDR的一个基本用途是测定恒定的个体差异,也就是应答风格。
长期以来人们一直很关心应答模式对准确测定某些内容的影响,有人认为,这种模式本身能反映出个体的深层心理结构。
对SDR对于测查影响的广泛关注可从重要的人格测验工具都毫无例外地包括SDR测量这一点得到充分反应。
MMPI包括两个这一类的量表:
说谎量表用以测定明显的掩饰,K量表针较为隐蔽的微妙的曲解。
艾森克人格调查表(EPI)和艾森克人格问卷也带有根据理论假设编制的说谎量表。
在Comrey人格量表中包含一个应答偏差分表。
其它如人格研究表、人格分类问卷、16-PF等等都有类似的分表。
除了MMPI两个有关分量表,对于其他商业化的SDR测评工具很少有直接的研究,其中原因之一是,这些SDR测查表在内容和风格上都要符合其所附属的测量表,离开测量表用处很少。
鉴于有关研究资料的缺乏,这里仅介绍7种用得较多的测量工具。
并希望读者在使用前必须考虑选用哪一个最能说明问题,最为合适。
SDR的类别
SDR测量中一个令人困扰的问题是,几个较为著名的测量工具之间相关不高。
对SDR测量工具的因子分析揭示出两个主要因子。
Paulhus(1984,1986)提出证据,指出这两个因子分别代表:
(1)自欺性拔高(诚实但过于肯定的自我表现,SDE);
(2)操纵印象(inpressionmanagement,迎合他人的自我表现)。
各种SDR测量工具在两个因子上的负荷有所不同:
PRF的期望量表及Edwards的SD量表主要负荷于自欺因子Wiggins的SD量表,EPQ的L量表主要负荷在IM因子,MarloweCrowne量表在两个因子都有负荷,但更偏重操纵印象因子。
采用“操纵印象”一词代表了有关SDR的一种传统观点:
有些人有意通过他们的回答为自已创造一种最佳的社会形象。
受试社会形象有许多方面,这一因子只能体现一个侧面,即:
符合社会常规,可以依赖。
“操纵印象”比说谎一词好,后者过于刺耳,而且充斥着谴责,而实际上受试可能只是为了避免社会的不认可而不如实表现自己。
无论用什么标签,这种倾向依情境和一时的动机而变,这些变异干扰受试自陈内容的有效性。
另一方面,自欺性拔高似乎似乎与适应、自尊乐观、对总体能力的感受等一些人格建构有本质的联系,这一点可通过自欺测量与精神卫生、自尊等各种测量的显著相关得到证明。
在“自欺”测量得高分者对自我的曲解是确定存在的,这可从其他一些个人情况中验证(Paulbus)。
两个因子的划分,至少解决了SDR研究中两个基本问题,第一,文献报告SDR和适应有正相关,而传统理论(包括常识)认为当是一种负相关,、作出区分后知道,SD与适应有正性相关,而IM与之几乎没有关系。
也就是说,SDR与适应的关系取决于于SDR的类型。
区分SDE与IM后澄清的第二个间题是,何以去除SDR在各种人格特征变量评定中的影响。
许多研究表明,控制SDE后会降低人格测量的预测效度。
因为它与许多人格特征有本质的联系。
需要控制的是IM,本文前面谈到的技术也主要适用于IM的控制。
下面介绍7种评定SDR的工具。
一、爱德华社会期望量表
EdwardsSocialDesirabilityScale(SD)
(Edwards,1957)
简介
Edwards指出,SD是用以测量“个体在自我描述时依照社会期望作回答的倾向”。
Edwards将从MMPI的K,F和L表中抽出的79个条目交给10位法官,请他们判定答案中“是”与“否”二者哪种更符合社会期望。
结果有39个条目法官的判定完全一致,这就构成了SD。
39个条目中有30个回答“否”计1分,其余9个答“是”计1分。
与MMPI一样,受试必须就“是”“否”选择其一。
因此,可能的得分范围是0-39分,高分表示更倾向社会所期望的回答。
对192名大学生测试,Edwards(1957)发现男生均数为28.6(SD=6:
5),女生为27.1(SD=6.5)。
Paulhus(1984)报告在匿名(n=60)和填写姓名(n=40)的情况下,均数分别为28.4(SD=5.5)和30.3(SD=4.9)。
Tanaka-Matsumi等(1986)测查503名学生,正常者均数为26.7(SD=6.3),抑郁者为20.9(Sd=5-3)。
信度和效度
信度:
在以上样本的测试中,α系数在0.83-0.87;Rore等报告的2周间隔的重测相关在男性为0.66,女性为0.68。
效度SD与其他测量社会期望性回答的工具都有很高的相关。
例如,与Jackson的社会期望性量表PRF的相关为0.71。
在区分效度方面,早期有人批评SD的39个条目中有22个与Talor的焦虑量表重叠,因此它不过是另外一个评定焦虑的工具而已。
同样,Crowne和Marlowe认为,因为SD的许多条目都涉及心理痛苦和烦恼,所以从本质上与精神病理问题有所混淆。
不过,Edwards(196劝将精神病理的条目替换以后,SD与其它测量工具的相关模式并无改变。
Edwards还就SD测定的内容与操纵印象量表测定的有意说谎作了区分,有关资料有力地支持了这一概念上的区分。
文献报告SD与MMPI相关很高(如:
Jackson&Messick,1962),由此引起很大争议。
有的研究者认为,这种相关提示MMPI所评估的不是病理心理间题,而是SDR。
但Block有力的提出,ASD反映了一种内在的特质,即自我弹性(egoresilieney)。
虽然大多数人都同意,SD反映的是一种综合性素质,但这种素质的确切性质却仍然没有答案。
应用与评价
关于SD的文献很多,但Edwards却几乎不曾谈到过其内在建构。
在最近(1988)所作的综述中,他仍然坚持采用一个操作性定义:
对量表条目作出社会所期望的回答的倾向。
也正因为如此,很难罗列出支持它的证据。
有如文献所载,SD显然是反应SDR的第一个因子(自欺性拔高),表明一种诚实的正性偏差。
Edwards最初认为,如果一个测量与SD相关很高,那么测量即无效,但这一点现在已经站不住脚了。
事实上,控制了SD以后,导致与适应相关的一些测量的效度下降(kozma&Stones)
幸运的是,Edwards的同事们1987年出版了一个不含病理心理条目的替代版本。
新版本与原版功能相似,这回击了30多年前的一些批评。
但新版本还有待其他研究者进行深人细致的探讨和检验。
量表条目与评价
SD全部条目取自MMPI,MMPI为版权所有的测评工具,不能在这里列出,仅给出手册中的题号。
以下9个条目答“是”计1分:
7,18,54,107,163,169,257,371,528。
以下30个条目答“否”计1分:
32,40,42,43,138,148,156,158,171,186,218,241,245,247,252,263,267,269,286,301,321,335,339,352,383,424,431,439,549,555。