调研问卷中多选题的分析方法探讨.docx

上传人:b****3 文档编号:5228937 上传时间:2022-12-14 格式:DOCX 页数:15 大小:1.58MB
下载 相关 举报
调研问卷中多选题的分析方法探讨.docx_第1页
第1页 / 共15页
调研问卷中多选题的分析方法探讨.docx_第2页
第2页 / 共15页
调研问卷中多选题的分析方法探讨.docx_第3页
第3页 / 共15页
调研问卷中多选题的分析方法探讨.docx_第4页
第4页 / 共15页
调研问卷中多选题的分析方法探讨.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

调研问卷中多选题的分析方法探讨.docx

《调研问卷中多选题的分析方法探讨.docx》由会员分享,可在线阅读,更多相关《调研问卷中多选题的分析方法探讨.docx(15页珍藏版)》请在冰豆网上搜索。

调研问卷中多选题的分析方法探讨.docx

调研问卷中多选题的分析方法探讨

调研问卷中多选题的分析方法探讨

引子

        使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用的信息。

其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到更有价值的结论。

       本篇主要探讨带有分类性质的多选题,如何进行深入分析,得出分类相关的结论,也可以对各类别进行排序。

 

带有分类性质的多选题

       一般而言,在设置多选题时,并没有想到分类,只是想了解各种情况的排序情况。

其实,某些多选题,已经隐含了分类的信息,透过这种潜在的分类信息,能够更深入地了解用户的内在想法、心理特征,甚至推测他们的行为习惯,与其他行为题目相互照应。

 

       带有分类价值的多选题一般具备以下几个特征:

       1、题干本身包含分类的含义,如最常遇到的障碍、最亟待解决的问题、最需要的功能、最常用的工具等,或直接询问:

哪些服务最适合划分为一类。

       2、选项涵盖内容较分散,如果选项都是集中某一个细节层面,那就没有分类的必要;只有当选项内容包含多个方面的细节点,且每个方面不止一个细节点,才有分类的必要。

此时的方面、细节需根据业务辩证地看,主要取决于选项是否有分类的意义。

       3、选项一般超过10个,选项太少没有分类的必要,只有超过一定数量,分类才有价值,分类的目的是为了通过细节概括出看问题的维度,更深入地解读用户心理或行为。

       4、限选,这不是必须的,主要根据经验判断,用户在做选择时,是否会倾向于全选,跟题干的问法有关。

无法做出准确判断,且需要对选项做出优先级排序时,通常采用限选的方式,可以根据研究目的,限定全部选项数量的一半,或1/3。

       5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。

 

       当有了带有分类价值的多选题,就可以采用下文介绍的方法进行深入分析。

       本文中的例子是半年前做过的一次定量调研,带有分类价值的多选题,主要考察:

淘宝卖家在经营店铺时,最需要的功能。

 

聚类分析

       首先,采用谱系聚类(Hierarchicalcluster)的分析方法,为了使得变量的分类趋于均匀,选择Ward’s法,二分类变量(Binary)欧式平方距离(SquaredEuclideandistance)测距方法,查看相应的统计量(略),并结合业务,找出分类数。

谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。

       综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一个功能,后续应用的价值有限。

 

 

因子分析

       聚类分析结果不理想,也可以采用因子分析的方法。

       经多次尝试,17个变量中去掉“直通车关键字检索”,单独成为一类。

剩余变量利用主成分分析法(Principalcomponents),方差最大正交旋转(Varimax)进行运算,得到KMO值为0.545,Bartlett球形检验的值为1041.324(df=120)达到显著,表明可以做因子分析。

最终萃取出7个公因子,累积方差贡献率为55.1%(详见下表),解释效果尚可。

       结合业务来看,这些分类能够很好地被解释,从而反映出卖家的心理特征和需求方向。

 

注:

由于本例是多选题,并非量表打分题,且侧重考查的不是变量间的建构效度,仅借用了因子分析的方法进行分类,因此KMO检验和累积方差贡献率的具体值,并没有真正的因子分析那么重要,但必须要查看,甚至需要做信度检验,也要查看重构的相关矩阵残差值,做到心中有数,知其然也要知其所以然。

本例中,重构的相关矩阵中,有超过半数残差值大于0.05,如果按照真正的因子分析模型来判断,拟合效果并不好。

 

相关分析

       还有一种简单易行的方法,就是相关分析。

经统计学家研究表明,0/1变量同样适用于皮尔逊相关系数(PearsonCorrelation)。

       本例将17个功能做相关分析,得到简化的相关矩阵如下表:

       根据研究目的,此表只需看正向、且相关非常显著的选项即可,但17*17个表格中127个有关联,如何做深入分析呢?

根据选项间的关系强弱、是否显著等,可以画出图形,如此,就可以清晰地看出各选项之间的关系,进行分类。

       本例中,此种方式的分类结果(如下图),易于解释,且分类数量恰当,便于后续应用。

 

三种方法所得结果的对比

       以上提到的三种方法,所得结果如下表:

       可以看出,聚类分析的结果容易出现不易解释的分类,因子分析的结果划分得更细化,相关分析的结果可以根据需要,在一定范围内进行调节,得出适当的分类数量。

       不同的案例,应该多尝试不同方法,即便相关分析的结果最可靠,其他方法的结果也能起到补充的作用,以获得更加有价值的研究结论。

 

进一步的应用

       得到合理的分类后,还可以结合选项的频率,给每一个类别赋值,得到类别的优先级排序。

       如果最终选定了因子分析的分类结果,单个类别中每个选项的权重可以由因子载荷计算而来;当然,也可以跟聚类分析、相关分析的结果一样,采用算数平均、或加权平均的方法,计算每个类别的平均值。

 

小结

       综上所述,带有分类性质的多选题,分析的流程如下:

       1、确定是否有带有分类价值的变量;

       2、尝试多种方法进行分析,找出最合理的分类;

       3、利用加权平均,或其他方法,计算每个类别的比例,进行排序。

       4、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题分类上的差异,深入分析。

带有求和性质的多选题

        问卷调研中,常会通过多选题考察用户在某个方面的多样性、或意识、能力等,此时,选项求和所得总分能够反映用户在这个方面的综合情况,也是一种分析问题的方法。

        其实,带有求和性质的题目,多半是由量表题转换而来,而量表题涉及到N级量表,相当于每个项目(选项)都是一个题目,为了节约用户的填答成本,常用多选题代替。

当然,量表题的相关选项求和,更能反映用户在某一方面的综合水平,此不赘述。

        带有求和性质的多选题一般具备以下几个特征:

        1、题目本身具有求和的价值,如卖家常用的第三方服务工具(考察工具应用的多样性)、卖家日常采用的安全保护措施(考察预防意识)、用户常用的网络功能(考察网络使用能力)等,这类题目的选项求和所得总分,对于综合分析问题有一定的参考价值。

        2、选项涵盖的内容较全面,选项应该尽量包含考察方面的主要细节点,如果考察的方面,范围相对较窄,最好能够穷尽主要细节点;如果考察的方面,范围相对较广,最好能由浅入深、或同级区隔,分成若干层面,逐个选取主要细节点。

        3、选项一般超过5个,选项太少没有求和的必要,只有超过一定数量,求和才有价值,求和的目的是为了通过归纳的方式,从总体认知的角度,概括地解读用户的行为或心理。

        4、通常不限选,如果限选,求和后,总分值差距不大,不易找出样本在考察方面的差异,很难达到综合评估的目的。

        5、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。

        当有了带有求和性质的多选题,就可以采用下文介绍的方法进行深入分析。

        本文中两个网络问卷调研的例子,分别是上个季度做的《卖家安全需求调研》,研究模型中用一道多选题,考察了卖家安全保护措施的意识;四年前写毕业论文《生活形态与即时通讯使用的关联性研究》时,基础题目中用一道多选题,考察了网民对网络的使用能力。

 

直接求和

        直接求和的方法非常简单,由于多选题选项的数据是0/1格式,直接加和后,即可表示在考察方面,样本的总得分,反映综合水平。

        卖家安全保护措施意识的案例,稍微复杂一些,因为选项含有互斥关系,各选项的频率如下表:

  

        

        求和时,不能直接相加,需要简单处理一下,因为“没有什么预防或应急措施”与其他答案互斥,有两种处理方法:

        1、将“没有什么预防或应急措施”的答案0/1做反向处理(recode处理:

0变1、1变0),之后所有选项加和,若总分为0,则表示“安全预防意识”为0,若总分大于0,则表示采取了一定的措施,反映了安全预防意识的程度;

        2、根据情况计算总分,若“没有什么预防或应急措施”被选中,则选项加和变量直接为0;若“没有什么预防或应急措施”未被选中,则剩余选项加和求得总分。

此时,选项加和的结果与方法1相同。

        本例中,卖家总体的安全预防意识平均值为2,结合总分的分布图也可以看出,卖家的安全预防意识并不强,手段比较单一,风险较高。

        

        跟其他变量交叉分析后,也可以分析出各细分群体,在安全预防意识方面的差异。

        直接求和,除了需要注意选项间的互斥情况,最重要的是要判断,各选项对于考察方面,是否处于同等级别,近似平等。

用案例来说,就是每个选项中的措施代表安全预防意识的程度相近,而并非某个措施的难度特别大,或非常不易达成。

        如果各选项对于考察方面,并非处于同等级别,不能近似平等,那么就需要采用其他的求和方法。

 

加权求和

        考察网民对网络的使用能力,如果直接询问被访者,“网络使用能力达到什么水平?

”,可能不易得到可靠的数据,可以间接地采用多选题的方式,请被访者选出懂得如何操作的网络应用,选项应该包含初、中、高级的网络应用,以便全面评估。

        由于初、中、高级的网络应用之间,级别不同等,不能近似平等,也就不能直接求和,简单相加会造成很大误差,不能如实反映网络使用能力。

        因此,先对选项进行信度检验,然后通过加权法,对需要能力较高的网络应用给予比较大的权数,能力要求不太高的网络应用给予较小的权数。

如此,得到的加权后总分越高,表示网络使用能力越高。

        在实践中经常采用的加权方法是,将直接测量值x(得分或比例等)转化为标准正态得分Z,再转化为加权值W,即可求得描述综合水平的测量值X。

        本例中,网络能力多选题的Cronbach’sAlpha信度检验,得到Alpha=0.841,达到较高水平;然后将各项的样本比例P转化成标准正态得分Z,由Z的相对大小来决定加权数W,即可计算出每个样本的网络使用能力。

分析可知,样本的网络使用能力均值为27.9,标准差为12.96。

计算过程如下表:

        

 

利用总分进行分组

        求和得到总分后,可以对样本进行分组,一般会找出高分组和低分组,对比高低分组在其他关键变量的情况,也是一种分析问题的视角。

        对总分进行分组通常有两种方法:

        1、高分组的下限可以是(均值+1个标准差);低分组的上限可以是(均值−1个标准差),一般这种方法求得的高低分组的样本量,均不一定会达到样本总量的1/4,需根据研究目的判断是否合适。

研究小众产品时,可用此方法。

        2、另一种方法,是将总分升序排列,从上往下,在样本总量27%的位置记录样本得分,作为低分组的上限临界值;从下往上,在样本总量27%的位置记录样本得分,作为高分组的下限临界值。

这种方法得到的高低分组的样本量,能满足大部分研究的需要。

研究大众产品时,可用此方法。

 

小结

        综上所述,带有求和性质的多选题,分析的流程如下:

        1、确定多选题的选项求和后,总分是否存在解读价值、应用价值;

        2、根据选项的特点,选取适当的求和方法:

直接求和、加权求和;

        3、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题总分上的差异,深入分析;

              或利用总分对样本进行分组,重点分析高低分组在其他变量上的表现。

带有递进逻辑的多选题

       问卷调研中,常会通过多选题考察用户在某个方面不同层次的情况,如对某个卖家产品各功能的使用情况(经常使用的功能)、使用的满意情况(满意的功能)、需要改进的情况(亟需改进的功能)等,题目与题目之间是同一个问题的不同层次,存在递进的逻辑关系,即使用频率高低与是否满意、是否亟需等,三者之间分别存在逻辑关系。

       此时,这种存在递进逻辑的多选题,可以首先考察不同题目相同选项之间的相关性;其次,能够衍生出新的题目,进行深入分析,挖掘表面背后的原因。

       其实,这种带有递进逻辑的多选题,可以采用量表的形式进行考察,而量表题涉及到N级量表,相当于每个项目(选项)都是一个题目,具有递进逻辑的项目之间,进行相关分析、衍生变量分析,更能深入挖掘用户在某一方面的综合情况。

只是为了节约用户的填答成本,常用多选题代替。

       另外,衍生出的新题目,也是可以通过直接询问的方式获得的,但通常题目带有递进逻辑时,需要用户深入全面思考,耗费的精力较大,也容易造成理解上的偏差,给研究结论带来较大的非抽样误差。

因此,通过多个简单的题目,计算出带有递进逻辑的结果,更易行更有效。

       带有递进逻辑的多选题一般具备以下几个特征:

       1、题目与题目之间的递进逻辑存在分析价值,如对某个卖家产品各功能的考察中,卖家对产品功能是否满意与是否亟需改进之间的递进关系,对于产品改进的方向、改进的优先级等有较大的参考价值。

如果是满意但亟需改进,表明该功能可能需要创新;若不满意但没有亟需改进,则说明该功能的改进优先级可以适当靠后。

       2、相关题目之间的选项相同,选项若不对应,或部分对应,会造成递进逻辑关系不紧密,容易引起结果出现偏差。

       会有特殊情况,如某产品经常使用的功能选项,除主要功能外,还有一个互斥的选项“不常用以上功能”;亟需改进的功能选项,除主要功能外,也有一个互斥的选项“均不需要改进”。

这类情况中,题目多出来的互斥选项只是为了解决题目设置为必选时,满足某种特殊情况,主要功能仍然是一一对应的,不对应的互斥选项,后续不进入递进关系的分析。

       3、相关题目的选项尽可能覆盖全面,选项尽量能够覆盖考察的主要细节点,以免用户过多地选择“其他”选项,削弱了分析递进关系的可能性。

       4、相关题目的选项个数最好超过3个,如果选项只有3个或更少,将多选题改为量表题,用户的填答成本不太大,获得的信息会更多,后续利用递进关系进行分析时,可以更加深入。

       5、相关题目设置限选时需考虑递进逻辑,若同时限选,限选的个数最好相同;由于递进关系通常是由弱到强,有时可以设置递进关系较弱的题目不限选,较强的题目限选,如满意的功能不限选,亟需改进的功能限选,可以分析递进关系中的强度。

但如果递进关系较弱的题目限选,而递进关系较强的题目不限选,则容易造成解读上的偏差,带来不必要的麻烦。

       6、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。

       当调研问卷中设置了带有递进逻辑的多选题,就可以采用下文介绍的方法进行深入分析。

       本文中的例子,采用年初时自主发起的《卖家旺铺选择研究》,研究中涉及两套递进关系的题目:

       您目前已经在用的旺铺功能有哪些?

(可多选)

       您目前最需要的旺铺功能有哪些?

(可多选,最多9项)

       您目前使用旺铺主要解决了哪些问题?

(可多选)

       您最希望通过旺铺帮您解决哪些问题?

(可多选,最多6项) 

 

 相关分析

       本文的案例主要研究旺铺,根据版本分析更有价值。

以使用拓展版旺铺的用户为例,分别计算已经在用的功能和最需要的功能,再对每一个功能在用的和最需要的变量做相关分析,能够得到如下结论(详见下图,数字略):

       1、已经在用的高比例,同时最需要的也是高比例的功能,对于拓展版旺铺而言,是需要维持的功能。

       2、需要维持的功能中,个性化店招、数据分析工具、宝贝30天销售量累积显示、自定义页面布局等功能,在用的与最需要的之间存在显著相关(图中已星号标注,*代表显著相关,**代表非常显著相关),从一个侧面表明,已经在用的用户尤为需要这些功能;而其中没有显著相关的功能,则不能得出这样的结论。

       3、已经在用的比例不高,而最需要的比例较高的功能,对于拓展版旺铺而言,是需要加强的功能。

       4、需要加强的功能中,营销工具组合、不限类型的旺铺装修模板等功能,在用的与最需要的之间存在显著相关,从一个侧面表明,已经在用的用户对这两个功能的期望较高,也特别需要这两个功能。

       5、另外,从具体数据上可以看出,虽然拓展版用户已经在用高级发货、进销存管理、客户关系管理等功能的比例不高,但最需要这三个功能的比例远超过在用的比例,表明部分拓展版用户对这三个功能的需求很旺盛。

而这三个功能是旗舰版的功能,反映了这部分用户应该选择更高版本的旺铺。

      注:

虽然高级版本的旺铺中包含一些特有的功能,但这些功能附属的工具可以单独购买,所以,会出现使用低版本旺铺的用户,已经在用某些高版本的功能。

情况相对复杂,分析时需要注意,下文雷同,不再赘述。

 

衍生变量分析

       以使用扶植版旺铺的用户为例,因为“目前使用旺铺解决了的问题”与“最希望通过旺铺帮助解决的问题”存在递进逻辑关系,可以衍生出两个比较关键的变量,即已经解决了且希望解决的问题、尚未解决但希望解决的问题。

       有了这两个变量,可以更加深入地分析,希望解决的问题具体情况是怎样的,最终分析结论如下(详见下图,数字略):

       1、提升店铺的流量、增加店铺的可信度、增加店铺的专业程度等,是使用扶植版旺铺的用户非常关注的问题,不论目前是否解决,都非常希望通过旺铺解决,表明这三方面是需要维持的利益点,也是宣传扶植版旺铺的重点。

       2、装修更便利、店铺更美观等,是目前解决了,但仍希望通过旺铺解决的问题,表明这部分使用扶植版旺铺的用户,对装修的便利性、装修效果等更重视,希望能做到更好,可以对他们做相应的培训,或直接向他们推荐装修更灵活、呈现更多样的高版本旺铺。

(之所以得到这样的结论,主要是因为最希望通过旺铺解决的问题是多选限选,可以根据以往研究经验,假设需求强度不大,已经解决了的问题,在最希望解决的问题中就不会再选了。

       3、提升宝贝的转化率/成交量、增加宝贝的点击率、增加买家在店铺的停留时长等,是目前尚未解决,但希望能够通过旺铺解决的问题,表明这部分扶植版旺铺的用户比较直接、实际,非常看重流量和销量,可以对他们做相应的指导,也可推荐引流量的工具或服务。

 

利用衍生变量深入分析

        本研究中在询问功能和解决的问题时,将多个版本的内容融合在一起,后续分析时,可以分析出目前使用某个版本的用户,目前是否适合当前版本,如果不适合,如何引导他们使用更适合的版本;如果适合,是否已经用得足够好,用得不好,如何帮助他们。

这些疑问,可以利用衍生变量进行深入分析,从而得到答案。

        以使用标准版旺铺的用户为例,首先要明确四个前提步骤:

        Step1、由于功能和解决的问题是多个版本融合在一起,需要分清哪些功能是当前版本的,哪些是更高版本才有的,旺铺的高版本兼具低版本的功能。

        Step2、分析中需要结合旺铺版本,衍生出一个变量,叫做“更适合的功能点”,即目前未使用,但最需要的功能,且这个功能又是更高版本的旺铺功能;

        还需要衍生出另一个变量,叫做“未用好的功能点”,即目前未使用,但最需要的功能,且这个功能是当前版本具备的旺铺功能。

        Step3、以往的定性调研表明,一个使用低版本旺铺的用户之所以选择更高版本,往往是看上了高版本的其中一个功能,如宝贝30天销量累积显示。

        本例在判断部分使用当前版本的用户,实际上适合更高版本旺铺时,采用了保守的方式,找出前提2中排名前三位的“更适合的功能点”,取平均值,把它当做更适合高版本旺铺的当前版本用户的比例。

主要基于假设,这些功能对他们相当重要,理想状态下,后续他们会因为这些功能转用高版本旺铺。

        同样,适合但未用好当前版本的用户,也采用了类似的方式计算比例,此不赘述。

        Step4、若判定部分当前版本用户适合更高版本旺铺,还需要有促使他们转换的利益点,这些利益点也可以由衍生变量得到,即目前使用旺铺未解决但最希望通过旺铺解决的问题。

        最终可以得出标准版旺铺的用户,更适合高版本的比例,以及更适合他们的功能点是什么,促使他们转换的利益点是什么。

从而指导后续工作,促使这部分用户成功转换到高版本旺铺。

        也可以找出适合当前版本但未用好的比例,摸清哪些功能点他们没有用好,能够更有针对性地培训,使其充分发挥旺铺的功能。

 

 

小结

        综上所述,带有递进逻辑的多选题,分析的流程如下:

        1、确定在设计问卷时,是否包含递进逻辑的多选题,并确保题目的递进关系存在解读价值、应用价值;

        2、根据题目的特点,衍生出新的变量;

        3、根据衍生变量的统计量,深入分析样本的相关情况;

        4、可以根据其他关键变量(如旺铺版本、星级等)对衍生变量做进一步分析,从而得出更深入的研究结论。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1