纪浩然市场调研数据的应用分析.docx
《纪浩然市场调研数据的应用分析.docx》由会员分享,可在线阅读,更多相关《纪浩然市场调研数据的应用分析.docx(15页珍藏版)》请在冰豆网上搜索。
![纪浩然市场调研数据的应用分析.docx](https://file1.bdocx.com/fileroot1/2022-11/15/5f90c3e1-1a8d-4b3f-ad3d-73f5eccc16bf/5f90c3e1-1a8d-4b3f-ad3d-73f5eccc16bf1.gif)
纪浩然市场调研数据的应用分析
市场调研数据的应用分析
纪浩然
学习导航
通过学习本课程,你将能够:
●学会开展消费者品牌喜好分析;
●做好消费者行为分析;
●掌握客户细分研究的过程;
●预测市场的发展态势。
市场调研数据的应用分析
一、消费者品牌喜好分析
营销分析中一个很重要的问题就是品牌分析。
品牌分析的核心问题,就是搞清楚哪些因素决定了消费者的品牌选择。
品牌分析的三个问题包括:
第一,是否选择该品牌;第二,多个品牌的选择问题;第三,有序品牌的选择问题,例如高端品牌、中端品牌和低端品牌。
这三个问题与离散量的三种类型,即二元值、名义值和有序值恰好对应。
1.二值Logistic回归
图1方程中的变量
操作过程
如图1所示,该示例调查的是年龄、皮肤黑白程度、职业、体重、收入分级等要素对美白化妆品消费的影响。
首先进入SPSS的“分析”模块,选择“回归”模型中的二元logistic回归,将是否购买放入因变量中,将年龄、皮肤黑白程度、职业等需要考虑的要素选入协变量(也即自变量)中,然后点击“确定”,输出结果。
结果解读
在案例处理汇总中,logistic回归是一个迭代过程,分为很多迭代步骤。
在此,最重要的是商业结论。
如图1所示。
图1输出的结果中,R平方的数值为0.376,表明拟合程度比较一般。
但是在现实中遇到这种情况时,可以稍微变通让其通过,而不会再做一遍调研。
检验p值基本都大于0.05,说明模型解释情况不是太好,但是对于二元logistic回归基本都是如此。
根据表中的常量,可以得出下面的回归方程:
购买=3.224-0.064*年龄-0.431*皮肤黑白程度-1.506*职业-0.007*体重+2.057*收入分级
与之对应的商业结论是:
对化妆品购买影响程度较大的三个因素依次是收入(正相关)、职业(负相关)和皮肤黑白程度(负相关),年龄和体重的影响则不明显,其中影响最大的因素是收入。
需要注意的是,当研究的因变量是一个跳跃值时,绝对不能用线性回归,而是要用logistic回归。
2.名义值的Logistic回归
操作过程
关于购车情况的调查,直接进入值标签,可以看到作为研究对象的购车类型是跳跃值,分为家用车、工作用车和跑车三种,要分析的是性别、婚姻状况、国别、车的尺寸和年龄对于三种购车类型的影响大小,其中年龄以30岁为“割点”进行了离散化分组,小于30为“1”,大于30为“2”。
这时开始进行“回归”操作,由于三种购车类型之间无明显排序,属于“名义值”,所以采用与之对应的多项logistic回归,选入购车类型,然后将性别、婚姻状况、国别、尺寸和年龄分段选进去,其他的采用默认值,点击“确定”,输出结果。
结果解读
输出结果显示,伪R方数值为0.259,该结果仍然具有一定的意义。
如图2所示。
图2模型拟合信息和伪R方
图3似然比检验
由于将家庭用车、工作用车和跑车分别对应“1”“2”“3”,经过模型换算,事实上是用家庭用车、工作用车分别和跑车对比,所以在模型输出时会有两个回归方程,分别对应家庭用车和工作用车。
(同理:
如果将工作用车当作比较对象,最后就会输出家庭用车和跑车的方程。
)
图4、图5分别为家用车和工作用车的输出结果。
注:
表格中“B”栏表示系数。
图4参数估计——家用
图4对应的回归方程:
购买=1.054-0.38*性别1(男)-1.308*婚姻状况1(未婚)+0.206*国别1(美国)-0.992*国别2(欧洲)+3.676*尺寸1(大)+0.885尺寸2(中)-0.913*年龄超过30*1(年青)。
图5参数估计——工作用车
图5对应的回归方程:
购买=0.163-0.22*性别1(男)-0.96*婚姻状况1(未婚)-0.193*国别1(美国)-1.343*国别2(欧洲)+3.582*尺寸1(大)-0.304*尺寸2(中)-0.498*年龄超过30*1(年青)。
通过家庭用车和工作用车的对比,得出如下商业结论:
家用车多数由已婚者购买,多偏向于美系车,偏向于中大尺寸车辆,30岁以上购买较多;工作车同样购买者为已婚,偏向大尺寸车,不喜欢中尺寸车,同样30岁以上购买较多;工作用车对欧洲系车的拒绝程度要高于家用车,家用车对年轻人的拒绝程度要高于工作用车。
3.有序Logistic回归
操作过程
如图6所示,本例分析的是客户的年龄、收入、教育程度、性别等因素对于客户满意度的影响大小。
由于满意度有明显的高低顺序,所以选择有序logistic回归,将满意度放入因变量,将收入、文化程度、性别、年龄放入协变量,然后“确定”,输出模型结果。
图6参数估计量——满意度
结果解读
在结果中,R平方为0.157,效果一般,然后会得到客户满意度是1的情况,或客户满意度为2的情况两个回归方程,之后列出函数并进行对比,其操作过程与“名义logistic回归”相同。
二、消费者行为分析
1.最优尺度回归分析
在做回归分析时,会经常遇到分类变量,例如对于收入,通常划分为1、2、3,但是这种人为划分并不能保证变量之间是“等距”的。
SPSS的最佳尺度回归可以较好地解决这一问题,以保证分析结果的准确性。
操作过程
图7分析的是年龄、性别和职业等因素对于客户在5种服装颜色选择上的影响,以此了解不同年龄、性别和职业客户对各种服装颜色的偏好。
进入SPSS的“分析”,选择“回归”模型的“最佳尺度”,将颜色选为因变量,将年龄、性别和职业选为自变量,然后在颜色偏好度量中选“数字”,之所以不选“名义”或“有序”,是因为不知道它们之间的距离是否相等;在年龄中同样选“数字”;性别选“名义”;职业选“序数”,因为在本示例中对各种职业进行了排序。
可见,在进行市场调研分析时,必须要具体问题具体分析,要具备很强的分析能力、较宽的知识面和清晰的思路,并结合自己的具体工作进行变量定义,而不能死记硬背模型。
结果解读
在输出结果中,R平方是0.296。
通过上述几个示例可以看出,在logistic回归和最佳尺度回归中,R平方的数值都不理想,一般来说在这四种回归中不必太计较R平方值,与之相对,在线性回归分析中必须关注R平方值。
在最佳尺度回归分析中,主要关注下面的表格。
图7相关性和容差
如图7所示,“偏相关”是克服了其他的影响之后的估计;而“重要性”则是最佳尺度回归中最有价值的一列,表示的是各个自变量对于因变量影响的大小;最后则是“容差”,表示一个解释变量中不能被其他变量解释的比例,这一比例越高越好,比如图7中性别的容差是0.805,这就表示该因素中80.5%的解释成分是其他因素无法解释的。
2.结合分析
结合分析是专门针对正交设计的分析手段,SPSS目前没有专门的分析模块,需要自行输入命令行实现。
结合分析是分析用户多维度倾向性的重要手段。
如图8所示,在之前出现过的牛奶消费市场调查案例的结果数据,经过结合分析可见,在重要性值中包含了外形、品牌、价格、口感、保质期等因素,通过比较可以看出其中最重要的因素是品牌(PINPAI),平均重要性得分是30.678,然后依次是外形、价格、口感和保质期。
图8重要性值
在外形、品牌、价格、口感等各个因素下,又有各自的估计值。
如图9所示。
图9实用程序
同时,还以图示方式进行分析,如图10、图11、图12、图13、图14所示。
图10摘要实用程序——外形
图11摘要实用程序——品牌
图12摘要实用程序——口感
图13摘要实用程序——价格和保质期
三、客户细分研究
1.聚类
聚类是一种探索性的分析,分析者不用分类标准,而让软件针对数据进行一定程度上的分类。
比如,很多市场调研分析在做模型时,都希望将客户分为几个群,群之间的距离越大越好,而群内部的距离越小越好。
图15聚类的统计分析原理
市场调查中的聚类分析和一般的聚类分析不同,需要采用层次聚类法(系统聚类法)。
其原因是,K—均值聚类全部是针对连续性的变量,而在市场调查中多数采用性别、年龄、收入、职业等作为分类变量,这些变量属于离散变量,所以需要运用系统聚类法。
操作过程
如图16所示,将性别、年龄、学历、啤酒价格、消费场所、周饮用量等变量全部选进进行聚类,然后在统计量中绘制树状图,在聚类方法中选择“Ward”连接法——这是目前最常用和效率最高的方法,在转换值的标准化中选择“Z得分”,然后选择“保存”,让系统自动进行客户分群。
比如,可以从三到八进行6种分类。
然后点击“确定”,输出结果。
结果解读
在结果中,首先是Ward连接,其中相当于一个迭代过程,然后是树状图,可能是一个客户,也可能是一类不断聚集的过程,然后是模型解读,这里已经将客户做好分类。
之后在到“比较均值”中按照四类看一下均值,点击鼠标右键,显示客户名称,将客户分为四类,然后将性别、年龄、学历等全部选进来,然后进行分组求均值。
如图16所示。
图16均值
通过聚类分析,可以根据不同维度将客户分为以下几个特征差别明显的群:
群1:
白领女性群体。
平均年龄28.76岁,学历高(因为学历从低到高分为1、2、3、4四个组,所以平均值越大,表示学历越高,下同),在酒吧等高档场所喝较贵啤酒(消费场所分为“1”在家喝啤酒、“2”在餐厅喝啤酒、“3”在酒吧喝啤酒、“4”在歌厅喝啤酒四个分组,所以均值越大,表示地方越高档),饮用量小。
群2:
老年男性群体。
平均年龄55.56岁,学历低,主要在家里喝比较便宜的啤酒,饮用量较大。
群3:
年轻男性群体。
平均年龄22.30岁,学历较低,主要在家里喝比较便宜的啤酒,饮用量最大。
群4:
中年白领男性群体。
平均年龄32.07岁,学历高,在酒吧、歌厅等高档场所喝较贵啤酒,饮用量较大。
2.判别分析
如果已知对象的分类,需要知道该分类是否合理,并且判断某个对象的具体分类,则需要使用判别分析。
四、市场态势预测
回归是销售预测的重要手段,通过一元或者多元回归可以得到相关的预测方程。
1.一元线性回归
操作过程
在简单线性回归中,其中因变量是销售毛利率,而自变量则是销售铺货率,然后进行回归分析。
结果解读
在输出结果中,首先看R平方,数值为0.697,说明模型的拟合效果很好,其检验P值为0.003,说明可以接受。
预测函数为:
销售毛利率=1983.406+5.065*销售铺货率
之所以能采用这一方程,是因为后面的两个检验P值都小于0.05。
2.多元线性回归
操作过程
在销售预测中,多重线性回归用得相对较多。
如图17所示,分析的是成本、产量、工资率、租赁价格等因素对于产品价格的影响。
操作过程为:
选择“回归”模型中的线性回归,然后将产品价格放入因变量,将成本等因素放入自变量,然后进行回归分析,输出结果。
结果解读
在输出结果中,可以看到R平方的数值不理想,在销售预测中面对这一情况,通常看Anova分析的检验P值,这时可以看到,检验P值为0。
如图17所示。
图17Anova—检验P值
如图18所示,可以看到各个因素的影响系数以及最后的结论——决定产品价格的因素中,影响最大的因素是工资率。
图18系数
3.逐步多元回归
在态势预测中,最严谨的方法是逐步多元回归。
操作过程
如图19所示,该示例分析的是儿童的年龄和疾病之间的关系。
在对此进行数据分析时,可供选择的回归模型包括线性回归(一元、多元)、logistic回归和最佳尺度回归等。
为了探明哪种模型可以最好地模拟该数据的态势,需要进行一个“数据拟合”操作。
具体操作过程为:
进入SPSS的“分析”模块,选择“回归模型”中的“曲线估计”,将疾病阴性率定为因变量,将儿童年龄设为自变量,然后将SPSS提供的模型全部选中,点击“确定”。
结果解读
由于选中了线性、对数、倒数、二次、三次、符合、幂、S平方、增长、指数和Anova等多个模型,所以在结果中会