纪浩然市场调研数据的应用分析.docx

资源描述

纪浩然市场调研数据的应用分析.docx

《纪浩然市场调研数据的应用分析.docx》由会员分享，可在线阅读，更多相关《纪浩然市场调研数据的应用分析.docx（15页珍藏版）》请在冰豆网上搜索。

纪浩然市场调研数据的应用分析.docx

纪浩然市场调研数据的应用分析

市场调研数据的应用分析

纪浩然

学习导航

通过学习本课程，你将能够：

●学会开展消费者品牌喜好分析；

●做好消费者行为分析；

●掌握客户细分研究的过程；

●预测市场的发展态势。

市场调研数据的应用分析

一、消费者品牌喜好分析

营销分析中一个很重要的问题就是品牌分析。

品牌分析的核心问题，就是搞清楚哪些因素决定了消费者的品牌选择。

品牌分析的三个问题包括：

第一，是否选择该品牌；第二，多个品牌的选择问题；第三，有序品牌的选择问题，例如高端品牌、中端品牌和低端品牌。

这三个问题与离散量的三种类型，即二元值、名义值和有序值恰好对应。

1.二值Logistic回归

图1方程中的变量

操作过程

如图1所示，该示例调查的是年龄、皮肤黑白程度、职业、体重、收入分级等要素对美白化妆品消费的影响。

首先进入SPSS的“分析”模块，选择“回归”模型中的二元logistic回归，将是否购买放入因变量中，将年龄、皮肤黑白程度、职业等需要考虑的要素选入协变量（也即自变量）中，然后点击“确定”，输出结果。

结果解读

在案例处理汇总中，logistic回归是一个迭代过程，分为很多迭代步骤。

在此，最重要的是商业结论。

如图1所示。

图1输出的结果中，R平方的数值为0.376，表明拟合程度比较一般。

但是在现实中遇到这种情况时，可以稍微变通让其通过，而不会再做一遍调研。

检验p值基本都大于0.05，说明模型解释情况不是太好，但是对于二元logistic回归基本都是如此。

根据表中的常量，可以得出下面的回归方程：

购买=3.224-0.064*年龄-0.431*皮肤黑白程度-1.506*职业-0.007*体重+2.057*收入分级

与之对应的商业结论是：

对化妆品购买影响程度较大的三个因素依次是收入（正相关）、职业（负相关）和皮肤黑白程度（负相关），年龄和体重的影响则不明显，其中影响最大的因素是收入。

需要注意的是，当研究的因变量是一个跳跃值时，绝对不能用线性回归，而是要用logistic回归。

2.名义值的Logistic回归

操作过程

关于购车情况的调查，直接进入值标签，可以看到作为研究对象的购车类型是跳跃值，分为家用车、工作用车和跑车三种，要分析的是性别、婚姻状况、国别、车的尺寸和年龄对于三种购车类型的影响大小，其中年龄以30岁为“割点”进行了离散化分组，小于30为“1”，大于30为“2”。

这时开始进行“回归”操作，由于三种购车类型之间无明显排序，属于“名义值”，所以采用与之对应的多项logistic回归，选入购车类型，然后将性别、婚姻状况、国别、尺寸和年龄分段选进去，其他的采用默认值，点击“确定”，输出结果。

结果解读

输出结果显示，伪R方数值为0.259，该结果仍然具有一定的意义。

如图2所示。

图2模型拟合信息和伪R方

图3似然比检验

由于将家庭用车、工作用车和跑车分别对应“1”“2”“3”，经过模型换算，事实上是用家庭用车、工作用车分别和跑车对比，所以在模型输出时会有两个回归方程，分别对应家庭用车和工作用车。

（同理：

如果将工作用车当作比较对象，最后就会输出家庭用车和跑车的方程。

）

图4、图5分别为家用车和工作用车的输出结果。

注：

表格中“B”栏表示系数。

图4参数估计——家用

图4对应的回归方程：

购买=1.054-0.38*性别1（男）-1.308*婚姻状况1（未婚）+0.206*国别1（美国）-0.992*国别2（欧洲）+3.676*尺寸1（大）+0.885尺寸2（中）-0.913*年龄超过30*1（年青）。

图5参数估计——工作用车

图5对应的回归方程：

购买=0.163-0.22*性别1（男）-0.96*婚姻状况1（未婚）-0.193*国别1（美国）-1.343*国别2（欧洲）+3.582*尺寸1（大）-0.304*尺寸2（中）-0.498*年龄超过30*1（年青）。

通过家庭用车和工作用车的对比，得出如下商业结论：

家用车多数由已婚者购买，多偏向于美系车，偏向于中大尺寸车辆，30岁以上购买较多；工作车同样购买者为已婚，偏向大尺寸车，不喜欢中尺寸车，同样30岁以上购买较多；工作用车对欧洲系车的拒绝程度要高于家用车，家用车对年轻人的拒绝程度要高于工作用车。

3.有序Logistic回归

操作过程

如图6所示，本例分析的是客户的年龄、收入、教育程度、性别等因素对于客户满意度的影响大小。

由于满意度有明显的高低顺序，所以选择有序logistic回归，将满意度放入因变量，将收入、文化程度、性别、年龄放入协变量，然后“确定”，输出模型结果。

图6参数估计量——满意度

结果解读

在结果中，R平方为0.157，效果一般，然后会得到客户满意度是1的情况，或客户满意度为2的情况两个回归方程，之后列出函数并进行对比，其操作过程与“名义logistic回归”相同。

二、消费者行为分析

1.最优尺度回归分析

在做回归分析时，会经常遇到分类变量，例如对于收入，通常划分为1、2、3，但是这种人为划分并不能保证变量之间是“等距”的。

SPSS的最佳尺度回归可以较好地解决这一问题，以保证分析结果的准确性。

操作过程

图7分析的是年龄、性别和职业等因素对于客户在5种服装颜色选择上的影响，以此了解不同年龄、性别和职业客户对各种服装颜色的偏好。

进入SPSS的“分析”，选择“回归”模型的“最佳尺度”，将颜色选为因变量，将年龄、性别和职业选为自变量，然后在颜色偏好度量中选“数字”，之所以不选“名义”或“有序”，是因为不知道它们之间的距离是否相等；在年龄中同样选“数字”；性别选“名义”；职业选“序数”，因为在本示例中对各种职业进行了排序。

可见，在进行市场调研分析时，必须要具体问题具体分析，要具备很强的分析能力、较宽的知识面和清晰的思路，并结合自己的具体工作进行变量定义，而不能死记硬背模型。

结果解读

在输出结果中，R平方是0.296。

通过上述几个示例可以看出，在logistic回归和最佳尺度回归中，R平方的数值都不理想，一般来说在这四种回归中不必太计较R平方值，与之相对，在线性回归分析中必须关注R平方值。

在最佳尺度回归分析中，主要关注下面的表格。

图7相关性和容差

如图7所示，“偏相关”是克服了其他的影响之后的估计；而“重要性”则是最佳尺度回归中最有价值的一列，表示的是各个自变量对于因变量影响的大小；最后则是“容差”，表示一个解释变量中不能被其他变量解释的比例，这一比例越高越好，比如图7中性别的容差是0.805，这就表示该因素中80.5%的解释成分是其他因素无法解释的。

2.结合分析

结合分析是专门针对正交设计的分析手段，SPSS目前没有专门的分析模块，需要自行输入命令行实现。

结合分析是分析用户多维度倾向性的重要手段。

如图8所示，在之前出现过的牛奶消费市场调查案例的结果数据，经过结合分析可见，在重要性值中包含了外形、品牌、价格、口感、保质期等因素，通过比较可以看出其中最重要的因素是品牌（PINPAI），平均重要性得分是30.678，然后依次是外形、价格、口感和保质期。

图8重要性值

在外形、品牌、价格、口感等各个因素下，又有各自的估计值。

如图9所示。

图9实用程序

同时，还以图示方式进行分析，如图10、图11、图12、图13、图14所示。

图10摘要实用程序——外形

图11摘要实用程序——品牌

图12摘要实用程序——口感

图13摘要实用程序——价格和保质期

三、客户细分研究

1.聚类

聚类是一种探索性的分析，分析者不用分类标准，而让软件针对数据进行一定程度上的分类。

比如，很多市场调研分析在做模型时，都希望将客户分为几个群，群之间的距离越大越好，而群内部的距离越小越好。

图15聚类的统计分析原理

市场调查中的聚类分析和一般的聚类分析不同，需要采用层次聚类法（系统聚类法）。

其原因是，K—均值聚类全部是针对连续性的变量，而在市场调查中多数采用性别、年龄、收入、职业等作为分类变量，这些变量属于离散变量，所以需要运用系统聚类法。

操作过程

如图16所示，将性别、年龄、学历、啤酒价格、消费场所、周饮用量等变量全部选进进行聚类，然后在统计量中绘制树状图，在聚类方法中选择“Ward”连接法——这是目前最常用和效率最高的方法，在转换值的标准化中选择“Z得分”，然后选择“保存”，让系统自动进行客户分群。

比如，可以从三到八进行6种分类。

然后点击“确定”，输出结果。

结果解读

在结果中，首先是Ward连接，其中相当于一个迭代过程，然后是树状图，可能是一个客户，也可能是一类不断聚集的过程，然后是模型解读，这里已经将客户做好分类。

之后在到“比较均值”中按照四类看一下均值，点击鼠标右键，显示客户名称，将客户分为四类，然后将性别、年龄、学历等全部选进来，然后进行分组求均值。

如图16所示。

图16均值

通过聚类分析，可以根据不同维度将客户分为以下几个特征差别明显的群：

群1：

白领女性群体。

平均年龄28.76岁，学历高（因为学历从低到高分为1、2、3、4四个组，所以平均值越大，表示学历越高，下同），在酒吧等高档场所喝较贵啤酒（消费场所分为“1”在家喝啤酒、“2”在餐厅喝啤酒、“3”在酒吧喝啤酒、“4”在歌厅喝啤酒四个分组，所以均值越大，表示地方越高档），饮用量小。

群2：

老年男性群体。

平均年龄55.56岁，学历低，主要在家里喝比较便宜的啤酒，饮用量较大。

群3：

年轻男性群体。

平均年龄22.30岁，学历较低，主要在家里喝比较便宜的啤酒，饮用量最大。

群4：

中年白领男性群体。

平均年龄32.07岁，学历高，在酒吧、歌厅等高档场所喝较贵啤酒，饮用量较大。

2.判别分析

如果已知对象的分类，需要知道该分类是否合理，并且判断某个对象的具体分类，则需要使用判别分析。

四、市场态势预测

回归是销售预测的重要手段，通过一元或者多元回归可以得到相关的预测方程。

1.一元线性回归

操作过程

在简单线性回归中，其中因变量是销售毛利率，而自变量则是销售铺货率，然后进行回归分析。

结果解读

在输出结果中，首先看R平方，数值为0.697，说明模型的拟合效果很好，其检验P值为0.003，说明可以接受。

预测函数为：

销售毛利率＝1983.406＋5.065*销售铺货率

之所以能采用这一方程，是因为后面的两个检验P值都小于0.05。

2.多元线性回归

操作过程

在销售预测中，多重线性回归用得相对较多。

如图17所示，分析的是成本、产量、工资率、租赁价格等因素对于产品价格的影响。

操作过程为：

选择“回归”模型中的线性回归，然后将产品价格放入因变量，将成本等因素放入自变量，然后进行回归分析，输出结果。

结果解读

在输出结果中，可以看到R平方的数值不理想，在销售预测中面对这一情况，通常看Anova分析的检验P值，这时可以看到，检验P值为0。

如图17所示。

图17Anova—检验P值

如图18所示，可以看到各个因素的影响系数以及最后的结论——决定产品价格的因素中，影响最大的因素是工资率。

图18系数

3.逐步多元回归

在态势预测中，最严谨的方法是逐步多元回归。

操作过程

如图19所示，该示例分析的是儿童的年龄和疾病之间的关系。

在对此进行数据分析时，可供选择的回归模型包括线性回归（一元、多元）、logistic回归和最佳尺度回归等。

为了探明哪种模型可以最好地模拟该数据的态势，需要进行一个“数据拟合”操作。

具体操作过程为：

进入SPSS的“分析”模块，选择“回归模型”中的“曲线估计”，将疾病阴性率定为因变量，将儿童年龄设为自变量，然后将SPSS提供的模型全部选中，点击“确定”。

结果解读

由于选中了线性、对数、倒数、二次、三次、符合、幂、S平方、增长、指数和Anova等多个模型，所以在结果中会

展开阅读全文