ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:1.58MB ,
资源ID:5228937      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5228937.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(调研问卷中多选题的分析方法探讨.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

调研问卷中多选题的分析方法探讨.docx

1、调研问卷中多选题的分析方法探讨调研问卷中多选题的分析方法探讨引子使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用的信息。其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到更有价值的结论。 本篇主要探讨带有分类性质的多选题,如何进行深入分析,得出分类相关的结论,也可以对各类别进行排序。带有分类性质的多选题 一般而言,在设置多选题时,并没有想到分类,只是想了解各种情况的排序情况。其实,某些多选题,已经隐含了分类

2、的信息,透过这种潜在的分类信息,能够更深入地了解用户的内在想法、心理特征,甚至推测他们的行为习惯,与其他行为题目相互照应。 带有分类价值的多选题一般具备以下几个特征: 1、题干本身包含分类的含义,如最常遇到的障碍、最亟待解决的问题、最需要的功能、最常用的工具等,或直接询问:哪些服务最适合划分为一类。 2、选项涵盖内容较分散,如果选项都是集中某一个细节层面,那就没有分类的必要;只有当选项内容包含多个方面的细节点,且每个方面不止一个细节点,才有分类的必要。此时的方面、细节需根据业务辩证地看,主要取决于选项是否有分类的意义。 3、选项一般超过10个,选项太少没有分类的必要,只有超过一定数量,分类才有

3、价值,分类的目的是为了通过细节概括出看问题的维度,更深入地解读用户心理或行为。 4、限选,这不是必须的,主要根据经验判断,用户在做选择时,是否会倾向于全选,跟题干的问法有关。无法做出准确判断,且需要对选项做出优先级排序时,通常采用限选的方式,可以根据研究目的,限定全部选项数量的一半,或1/3。 5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。 当有了带有分类价值的多选题,就可以采用下文介绍的方法进行深入分析。 本文中的例子是半年前做过的一次定量调研,带有分类价值的多选题,主要考察:淘宝卖家在经营店铺时,最需要的功能。聚类分析 首先,采用谱系

4、聚类(Hierarchical cluster)的分析方法,为了使得变量的分类趋于均匀,选择Wards法,二分类变量(Binary)欧式平方距离(Squared Euclidean distance)测距方法,查看相应的统计量(略),并结合业务,找出分类数。谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。 综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一个功能,后续应用的价值有限。因子分析 聚类分析结果不理想,也可以采用因子分析的方法。 经多次尝试,17个变量中去掉“直通车关键字检索”,单独成为一类。剩余变量利用主成分分析法(Princ

5、ipal components),方差最大正交旋转(Varimax)进行运算,得到KMO值为0.545,Bartlett 球形检验的值为1041.324(df=120)达到显著,表明可以做因子分析。最终萃取出7个公因子,累积方差贡献率为55.1%(详见下表),解释效果尚可。 结合业务来看,这些分类能够很好地被解释,从而反映出卖家的心理特征和需求方向。注:由于本例是多选题,并非量表打分题,且侧重考查的不是变量间的建构效度,仅借用了因子分析的方法进行分类,因此KMO检验和累积方差贡献率的具体值,并没有真正的因子分析那么重要,但必须要查看,甚至需要做信度检验,也要查看重构的相关矩阵残差值,做到心中有

6、数,知其然也要知其所以然。本例中,重构的相关矩阵中,有超过半数残差值大于0.05,如果按照真正的因子分析模型来判断,拟合效果并不好。相关分析 还有一种简单易行的方法,就是相关分析。经统计学家研究表明,0/1变量同样适用于皮尔逊相关系数(Pearson Correlation)。 本例将17个功能做相关分析,得到简化的相关矩阵如下表: 根据研究目的,此表只需看正向、且相关非常显著的选项即可,但17*17个表格中127个有关联,如何做深入分析呢?根据选项间的关系强弱、是否显著等,可以画出图形,如此,就可以清晰地看出各选项之间的关系,进行分类。 本例中,此种方式的分类结果(如下图),易于解释,且分类

7、数量恰当,便于后续应用。三种方法所得结果的对比 以上提到的三种方法,所得结果如下表: 可以看出,聚类分析的结果容易出现不易解释的分类,因子分析的结果划分得更细化,相关分析的结果可以根据需要,在一定范围内进行调节,得出适当的分类数量。 不同的案例,应该多尝试不同方法,即便相关分析的结果最可靠,其他方法的结果也能起到补充的作用,以获得更加有价值的研究结论。进一步的应用 得到合理的分类后,还可以结合选项的频率,给每一个类别赋值,得到类别的优先级排序。 如果最终选定了因子分析的分类结果,单个类别中每个选项的权重可以由因子载荷计算而来;当然,也可以跟聚类分析、相关分析的结果一样,采用算数平均、或加权平均

8、的方法,计算每个类别的平均值。小结 综上所述,带有分类性质的多选题,分析的流程如下: 1、确定是否有带有分类价值的变量; 2、尝试多种方法进行分析,找出最合理的分类; 3、利用加权平均,或其他方法,计算每个类别的比例,进行排序。; 4、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题分类上的差异,深入分析。带有求和性质的多选题问卷调研中,常会通过多选题考察用户在某个方面的多样性、或意识、能力等,此时,选项求和所得总分能够反映用户在这个方面的综合情况,也是一种分析问题的方法。其实,带有求和性质的题目,多半是由量表题转换而来,而量表题涉及到N级量表,相当于每个项目(选项)都

9、是一个题目,为了节约用户的填答成本,常用多选题代替。当然,量表题的相关选项求和,更能反映用户在某一方面的综合水平,此不赘述。带有求和性质的多选题一般具备以下几个特征:1、题目本身具有求和的价值,如卖家常用的第三方服务工具(考察工具应用的多样性)、卖家日常采用的安全保护措施(考察预防意识)、用户常用的网络功能(考察网络使用能力)等,这类题目的选项求和所得总分,对于综合分析问题有一定的参考价值。2、选项涵盖的内容较全面,选项应该尽量包含考察方面的主要细节点,如果考察的方面,范围相对较窄,最好能够穷尽主要细节点;如果考察的方面,范围相对较广,最好能由浅入深、或同级区隔,分成若干层面,逐个选取主要细节

10、点。3、选项一般超过5个,选项太少没有求和的必要,只有超过一定数量,求和才有价值,求和的目的是为了通过归纳的方式,从总体认知的角度,概括地解读用户的行为或心理。4、通常不限选,如果限选,求和后,总分值差距不大,不易找出样本在考察方面的差异,很难达到综合评估的目的。5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。当有了带有求和性质的多选题,就可以采用下文介绍的方法进行深入分析。本文中两个网络问卷调研的例子,分别是上个季度做的卖家安全需求调研,研究模型中用一道多选题,考察了卖家安全保护措施的意识;四年前写毕业论文生活形态与即时通讯使用的关联性研

11、究时,基础题目中用一道多选题,考察了网民对网络的使用能力。直接求和直接求和的方法非常简单,由于多选题选项的数据是0/1格式,直接加和后,即可表示在考察方面,样本的总得分,反映综合水平。卖家安全保护措施意识的案例,稍微复杂一些,因为选项含有互斥关系,各选项的频率如下表:求和时,不能直接相加,需要简单处理一下,因为“没有什么预防或应急措施”与其他答案互斥,有两种处理方法:1、将“没有什么预防或应急措施”的答案0/1做反向处理(recode处理:0变1、1变0),之后所有选项加和,若总分为0,则表示“安全预防意识”为0,若总分大于0,则表示采取了一定的措施,反映了安全预防意识的程度;2、根据情况计算

12、总分,若“没有什么预防或应急措施”被选中,则选项加和变量直接为0;若“没有什么预防或应急措施”未被选中,则剩余选项加和求得总分。此时,选项加和的结果与方法1相同。本例中,卖家总体的安全预防意识平均值为2,结合总分的分布图也可以看出,卖家的安全预防意识并不强,手段比较单一,风险较高。跟其他变量交叉分析后,也可以分析出各细分群体,在安全预防意识方面的差异。直接求和,除了需要注意选项间的互斥情况,最重要的是要判断,各选项对于考察方面,是否处于同等级别,近似平等。用案例来说,就是每个选项中的措施代表安全预防意识的程度相近,而并非某个措施的难度特别大,或非常不易达成。如果各选项对于考察方面,并非处于同等

13、级别,不能近似平等,那么就需要采用其他的求和方法。加权求和考察网民对网络的使用能力,如果直接询问被访者,“网络使用能力达到什么水平?”,可能不易得到可靠的数据,可以间接地采用多选题的方式,请被访者选出懂得如何操作的网络应用,选项应该包含初、中、高级的网络应用,以便全面评估。由于初、中、高级的网络应用之间,级别不同等,不能近似平等,也就不能直接求和,简单相加会造成很大误差,不能如实反映网络使用能力。因此,先对选项进行信度检验,然后通过加权法,对需要能力较高的网络应用给予比较大的权数,能力要求不太高的网络应用给予较小的权数。如此,得到的加权后总分越高,表示网络使用能力越高。在实践中经常采用的加权方

14、法是,将直接测量值x(得分或比例等)转化为标准正态得分Z,再转化为加权值W,即可求得描述综合水平的测量值X。本例中,网络能力多选题的Cronbachs Alpha信度检验,得到Alpha=0.841,达到较高水平;然后将各项的样本比例P转化成标准正态得分Z,由Z的相对大小来决定加权数W,即可计算出每个样本的网络使用能力。分析可知,样本的网络使用能力均值为27.9,标准差为12.96。计算过程如下表:利用总分进行分组求和得到总分后,可以对样本进行分组,一般会找出高分组和低分组,对比高低分组在其他关键变量的情况,也是一种分析问题的视角。对总分进行分组通常有两种方法:1、高分组的下限可以是(均值+1

15、个标准差);低分组的上限可以是(均值1个标准差),一般这种方法求得的高低分组的样本量,均不一定会达到样本总量的1/4,需根据研究目的判断是否合适。研究小众产品时,可用此方法。2、另一种方法,是将总分升序排列,从上往下,在样本总量27%的位置记录样本得分,作为低分组的上限临界值;从下往上,在样本总量27%的位置记录样本得分,作为高分组的下限临界值。这种方法得到的高低分组的样本量,能满足大部分研究的需要。研究大众产品时,可用此方法。小结综上所述,带有求和性质的多选题,分析的流程如下:1、确定多选题的选项求和后,总分是否存在解读价值、应用价值;2、根据选项的特点,选取适当的求和方法:直接求和、加权求

16、和;3、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题总分上的差异,深入分析;或利用总分对样本进行分组,重点分析高低分组在其他变量上的表现。带有递进逻辑的多选题问卷调研中,常会通过多选题考察用户在某个方面不同层次的情况,如对某个卖家产品各功能的使用情况(经常使用的功能)、使用的满意情况(满意的功能)、需要改进的情况(亟需改进的功能)等,题目与题目之间是同一个问题的不同层次,存在递进的逻辑关系,即使用频率高低与是否满意、是否亟需等,三者之间分别存在逻辑关系。此时,这种存在递进逻辑的多选题,可以首先考察不同题目相同选项之间的相关性;其次,能够衍生出新的题目,进行深入分析,

17、挖掘表面背后的原因。其实,这种带有递进逻辑的多选题,可以采用量表的形式进行考察,而量表题涉及到N级量表,相当于每个项目(选项)都是一个题目,具有递进逻辑的项目之间,进行相关分析、衍生变量分析,更能深入挖掘用户在某一方面的综合情况。只是为了节约用户的填答成本,常用多选题代替。另外,衍生出的新题目,也是可以通过直接询问的方式获得的,但通常题目带有递进逻辑时,需要用户深入全面思考,耗费的精力较大,也容易造成理解上的偏差,给研究结论带来较大的非抽样误差。因此,通过多个简单的题目,计算出带有递进逻辑的结果,更易行更有效。带有递进逻辑的多选题一般具备以下几个特征:1、题目与题目之间的递进逻辑存在分析价值,

18、如对某个卖家产品各功能的考察中,卖家对产品功能是否满意与是否亟需改进之间的递进关系,对于产品改进的方向、改进的优先级等有较大的参考价值。如果是满意但亟需改进,表明该功能可能需要创新;若不满意但没有亟需改进,则说明该功能的改进优先级可以适当靠后。2、相关题目之间的选项相同,选项若不对应,或部分对应,会造成递进逻辑关系不紧密,容易引起结果出现偏差。会有特殊情况,如某产品经常使用的功能选项,除主要功能外,还有一个互斥的选项“不常用以上功能”;亟需改进的功能选项,除主要功能外,也有一个互斥的选项“均不需要改进”。这类情况中,题目多出来的互斥选项只是为了解决题目设置为必选时,满足某种特殊情况,主要功能仍

19、然是一一对应的,不对应的互斥选项,后续不进入递进关系的分析。3、相关题目的选项尽可能覆盖全面,选项尽量能够覆盖考察的主要细节点,以免用户过多地选择“其他”选项,削弱了分析递进关系的可能性。4、相关题目的选项个数最好超过3个,如果选项只有3个或更少,将多选题改为量表题,用户的填答成本不太大,获得的信息会更多,后续利用递进关系进行分析时,可以更加深入。5、相关题目设置限选时需考虑递进逻辑,若同时限选,限选的个数最好相同;由于递进关系通常是由弱到强,有时可以设置递进关系较弱的题目不限选,较强的题目限选,如满意的功能不限选,亟需改进的功能限选,可以分析递进关系中的强度。但如果递进关系较弱的题目限选,而

20、递进关系较强的题目不限选,则容易造成解读上的偏差,带来不必要的麻烦。6、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。当调研问卷中设置了带有递进逻辑的多选题,就可以采用下文介绍的方法进行深入分析。本文中的例子,采用年初时自主发起的卖家旺铺选择研究,研究中涉及两套递进关系的题目:您目前已经在用的旺铺功能有哪些?(可多选)您目前最需要的旺铺功能有哪些?(可多选,最多9项)您目前使用旺铺主要解决了哪些问题?(可多选)您最希望通过旺铺帮您解决哪些问题?(可多选,最多6项)相关分析本文的案例主要研究旺铺,根据版本分析更有价值。以使用拓展版旺铺的用户为例

21、,分别计算已经在用的功能和最需要的功能,再对每一个功能在用的和最需要的变量做相关分析,能够得到如下结论(详见下图,数字略):1、已经在用的高比例,同时最需要的也是高比例的功能,对于拓展版旺铺而言,是需要维持的功能。2、需要维持的功能中,个性化店招、数据分析工具、宝贝30天销售量累积显示、自定义页面布局等功能,在用的与最需要的之间存在显著相关(图中已星号标注,*代表显著相关,*代表非常显著相关),从一个侧面表明,已经在用的用户尤为需要这些功能;而其中没有显著相关的功能,则不能得出这样的结论。3、已经在用的比例不高,而最需要的比例较高的功能,对于拓展版旺铺而言,是需要加强的功能。4、需要加强的功能

22、中,营销工具组合、不限类型的旺铺装修模板等功能,在用的与最需要的之间存在显著相关,从一个侧面表明,已经在用的用户对这两个功能的期望较高,也特别需要这两个功能。5、另外,从具体数据上可以看出,虽然拓展版用户已经在用高级发货、进销存管理、客户关系管理等功能的比例不高,但最需要这三个功能的比例远超过在用的比例,表明部分拓展版用户对这三个功能的需求很旺盛。而这三个功能是旗舰版的功能,反映了这部分用户应该选择更高版本的旺铺。 注:虽然高级版本的旺铺中包含一些特有的功能,但这些功能附属的工具可以单独购买,所以,会出现使用低版本旺铺的用户,已经在用某些高版本的功能。情况相对复杂,分析时需要注意,下文雷同,不

23、再赘述。衍生变量分析以使用扶植版旺铺的用户为例,因为“目前使用旺铺解决了的问题”与“最希望通过旺铺帮助解决的问题”存在递进逻辑关系,可以衍生出两个比较关键的变量,即已经解决了且希望解决的问题、尚未解决但希望解决的问题。有了这两个变量,可以更加深入地分析,希望解决的问题具体情况是怎样的,最终分析结论如下(详见下图,数字略):1、提升店铺的流量、增加店铺的可信度、增加店铺的专业程度等,是使用扶植版旺铺的用户非常关注的问题,不论目前是否解决,都非常希望通过旺铺解决,表明这三方面是需要维持的利益点,也是宣传扶植版旺铺的重点。2、装修更便利、店铺更美观等,是目前解决了,但仍希望通过旺铺解决的问题,表明这

24、部分使用扶植版旺铺的用户,对装修的便利性、装修效果等更重视,希望能做到更好,可以对他们做相应的培训,或直接向他们推荐装修更灵活、呈现更多样的高版本旺铺。(之所以得到这样的结论,主要是因为最希望通过旺铺解决的问题是多选限选,可以根据以往研究经验,假设需求强度不大,已经解决了的问题,在最希望解决的问题中就不会再选了。)3、提升宝贝的转化率/成交量、增加宝贝的点击率、增加买家在店铺的停留时长等,是目前尚未解决,但希望能够通过旺铺解决的问题,表明这部分扶植版旺铺的用户比较直接、实际,非常看重流量和销量,可以对他们做相应的指导,也可推荐引流量的工具或服务。利用衍生变量深入分析本研究中在询问功能和解决的问

25、题时,将多个版本的内容融合在一起,后续分析时,可以分析出目前使用某个版本的用户,目前是否适合当前版本,如果不适合,如何引导他们使用更适合的版本;如果适合,是否已经用得足够好,用得不好,如何帮助他们。这些疑问,可以利用衍生变量进行深入分析,从而得到答案。以使用标准版旺铺的用户为例,首先要明确四个前提步骤:Step1、由于功能和解决的问题是多个版本融合在一起,需要分清哪些功能是当前版本的,哪些是更高版本才有的,旺铺的高版本兼具低版本的功能。Step2、分析中需要结合旺铺版本,衍生出一个变量,叫做“更适合的功能点”,即目前未使用,但最需要的功能,且这个功能又是更高版本的旺铺功能;还需要衍生出另一个变

26、量,叫做“未用好的功能点”,即目前未使用,但最需要的功能,且这个功能是当前版本具备的旺铺功能。Step3、以往的定性调研表明,一个使用低版本旺铺的用户之所以选择更高版本,往往是看上了高版本的其中一个功能,如宝贝30天销量累积显示。本例在判断部分使用当前版本的用户,实际上适合更高版本旺铺时,采用了保守的方式,找出前提2中排名前三位的“更适合的功能点”,取平均值,把它当做更适合高版本旺铺的当前版本用户的比例。主要基于假设,这些功能对他们相当重要,理想状态下,后续他们会因为这些功能转用高版本旺铺。同样,适合但未用好当前版本的用户,也采用了类似的方式计算比例,此不赘述。Step4、若判定部分当前版本用

27、户适合更高版本旺铺,还需要有促使他们转换的利益点,这些利益点也可以由衍生变量得到,即目前使用旺铺未解决但最希望通过旺铺解决的问题。最终可以得出标准版旺铺的用户,更适合高版本的比例,以及更适合他们的功能点是什么,促使他们转换的利益点是什么。从而指导后续工作,促使这部分用户成功转换到高版本旺铺。也可以找出适合当前版本但未用好的比例,摸清哪些功能点他们没有用好,能够更有针对性地培训,使其充分发挥旺铺的功能。小结综上所述,带有递进逻辑的多选题,分析的流程如下:1、确定在设计问卷时,是否包含递进逻辑的多选题,并确保题目的递进关系存在解读价值、应用价值;2、根据题目的特点,衍生出新的变量;3、根据衍生变量的统计量,深入分析样本的相关情况;4、可以根据其他关键变量(如旺铺版本、星级等)对衍生变量做进一步分析,从而得出更深入的研究结论。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1