市场营销调研上机实验报告.docx
《市场营销调研上机实验报告.docx》由会员分享,可在线阅读,更多相关《市场营销调研上机实验报告.docx(31页珍藏版)》请在冰豆网上搜索。
市场营销调研上机实验报告
上机实验报告
课程名称:
市场营销调研
上机项目:
数据处理与分析
学生姓名:
专业班级:
市场营销2班
学号:
指导教师:
上机时间:
2013-12-3-2013-12-10
上机地点:
工1-B302
实验一:
SPSS数据文件整理和描述性统计分析
一、实验目的:
运用SPSS软件对采集的数据或者通过调查问卷收集的信息进行数据处理和分析:
一是用SPSS读取现成数据,
二是用SPSS录入数据资料;掌握描述性统计分析的方法,包括频数分析、描述性分析、探索分析、列联表分析等常用方法。
二、实验平台:
PC机,WindowsXP/2000及以上操作系统,SPSS软件。
3、实验内容和步骤:
1.读取现成的数据资料
运用两种方法读取现成的数据资料,从数据资源文件夹中任意读取2-5个文件。
方法一:
直接打开
方法二:
先打开spss,然后再选择指定文件打开。
读取数据结果截图
2.调查问卷中单选题、复选题与开放式问题的输入
(1)单选题录入,将下列问题录入到软件中
如果您有机会参观下面的某个城市,您会选择哪一个?
()西雅图()香港()纽约()巴黎
(2)复选题录入,将下列问题录入到软件中
请您选择所有您喜欢的活动(可多选)
()购物()散步()保龄球()滑雪()游泳()观鸟()划艇
(3)开放式问题的录入
您为什么喜欢喝那个牌子的啤酒(品牌已在前面的问题中提到过)
根据问卷调查得知的回答实例如下:
()因为它的口味较好
()它具有最好的味道
()我喜欢它的口味
()我不喜欢其他啤酒太重的口味
()它最便宜
()我买任何打折的啤酒,它大部分时间都在打折
()其他牌子使我头疼,但这种不会
()它不像其他牌子的啤酒那样使我的胃不舒服
()我已经喝了20多年
()它是大多数同事喝的牌子
()这是我妻子/丈夫在食品店中买的牌子
()这是我妻子/丈夫最喜欢的牌子
要求:
首先对回答实例进行回答类别分类,然后分配数字编码,最后录入到软件中。
多选题要分别设置标签,开放式试题需要先对题目的回答进行分类,然后确定几个主要的关键字,然后再按照单选题的方式输入。
第一个问题的值标签设置(单选)
3.问卷编码综合性训练(二选一)
根据提供的问卷,完成问卷编码的基本工作。
自带课程设计中问卷的同学,只需完成自己设计问卷的编码工作。
4.录入数据资料
书上352页-353页,表12-5美国家庭汽车保有量调研原始数据,输入前30份数据。
5.描述性分析
(1)频数分析
针对输入的关于美国家庭汽车保有量调研数据当中的“家庭收入”作频数分析,进行分析。
(2)描述性分析
针对输入的关于美国家庭汽车保有量调研数据当中的“家长受教育年数”进行描述性分析
(3)列联表分析
针对输入的关于美国家庭汽车保有量调研数据当中的“家庭收入”与“汽车保有量”进行列联表分析。
针对输入的关于美国家庭汽车保有量调研数据当中的“价值取向”与“汽车保有量”进行列联表分析。
针对输入的关于美国家庭汽车保有量调研数据当中的“居住地域”与“汽车保有量”进行列联表分析。
针对输入的关于美国家庭汽车保有量调研数据当中的“家庭人口”与“汽车保有量”进行列联表分析。
(4)综合实践分析(选做题)
针对已经进行问卷调查,具有调查数据的同学,对问卷中所需研究的变量进行分析,包括频数分析、描述性分析与列联表分析。
四、实验结果
2、问卷的录入
3、自己设计的问卷编码录入
4、录入数据资料
书上数据的录入:
数据录入页面结果如上图所示
(1)频数分析
本次实验录入数据总量30个,各收入的频率分布情况如上图所示,
可以发现数据集中在154-163百美元之间的比较多。
其中被调查的30户中收入在154百美元的最多,其次是163百美元,由此可见收入在中等水平的家庭可能较多。
(2)描述性分析
针对输入的关于美国家庭汽车保有量调研数据当中的“家长受教育年数”进行描述性分析。
描述统计量
N
极小值
极大值
均值
标准差
方差
峰度
统计量
统计量
统计量
统计量
统计量
统计量
统计量
标准误
家长受教育年数
30
6
12
10.60
1.940
3.766
.124
.833
有效的N(列表状态)
30
由计算结果图可以知道,最少受教育时间是6年,最长是12年。
在被统计的30户家庭内,平均受教育程度为10.6年。
方差为3.766,标准差为1.940。
(3)列联表分析
针对输入的关于美国家庭汽车保有量调研数据当中的“家庭收入”与“汽车保有量”进行列联表分析。
本实验未对收入进行分组,而且样本数据较少。
发现可以交叉相关联的数据很少,所以没有列出交叉列联表,无法进行具体分析。
针对输入的关于美国家庭汽车保有量调研数据当中的“价值取向”与“汽车保有量”进行列联表分析。
价值取向*汽车保有量交叉制表
汽车保有量
合计
1
2
价值取向
保守主义
计数
12
1
13
价值取向中的%
92.3%
7.7%
100.0%
汽车保有量中的%
42.9%
50.0%
43.3%
总数的%
40.0%
3.3%
43.3%
自由主义
计数
16
1
17
价值取向中的%
94.1%
5.9%
100.0%
汽车保有量中的%
57.1%
50.0%
56.7%
总数的%
53.3%
3.3%
56.7%
合计
计数
28
2
30
价值取向中的%
93.3%
6.7%
100.0%
汽车保有量中的%
100.0%
100.0%
100.0%
总数的%
93.3%
6.7%
100.0%
由上面的表格可以看出,汽车保有量为1的家庭中,保守主义占了43%,自由主义家庭占了57%。
汽车保有量为2的家庭中,保守主义和自由主义各占一半。
总体上,样本有93.3%的拥有一辆车,6.7%的家庭拥有两辆车。
所以不能以此判断自由主义比保守主义拥有的车更多,因为在调查的样本中保有量为2的情况下,两则没有明显差异。
但是在保有量为1的情况下,自由主义拥有一辆车的情况更多,但是差异也不明显。
可能价值观不是导致汽车拥有量的主要影响因素。
针对输入的关于美国家庭汽车保有量调研数据当中的“居住地域”与“汽车保有量”进行列联表分析。
居住地域*汽车保有量交叉制表
汽车保有量
合计
1
2
居住地域
北方
计数
25
1
26
居住地域中的%
96.2%
3.8%
100.0%
汽车保有量中的%
89.3%
50.0%
86.7%
总数的%
83.3%
3.3%
86.7%
南方
计数
3
1
4
居住地域中的%
75.0%
25.0%
100.0%
汽车保有量中的%
10.7%
50.0%
13.3%
总数的%
10.0%
3.3%
13.3%
合计
计数
28
2
30
居住地域中的%
93.3%
6.7%
100.0%
汽车保有量中的%
100.0%
100.0%
100.0%
总数的%
93.3%
6.7%
100.0%
分析上表,汽车保有量为1的家庭为28户,占到总体的93.3%,保有量为2的家庭为2户,占到总体的6.7%。
北方家庭汽车保有量为1的有25户,占到汽车保有量为1的总体的89.3%,南方汽车保有量为1为3户,占到10.7%,在汽车保有量为2的基础上,南北各占50%,无明显差异。
说明汽车保有量在区域上有明显差异北方明显比南方多,但是汽车拥有量的增加与区域无明显相关。
针对输入的关于美国家庭汽车保有量调研数据当中的“家庭人口”与“汽车保有量”进行列联表分析。
家庭人口*汽车保有量交叉制表
汽车保有量
合计
1
2
家庭人口
2
计数
7
2
9
家庭人口中的%
77.8%
22.2%
100.0%
汽车保有量中的%
25.0%
100.0%
30.0%
总数的%
23.3%
6.7%
30.0%
3
计数
11
0
11
家庭人口中的%
100.0%
.0%
100.0%
汽车保有量中的%
39.3%
.0%
36.7%
总数的%
36.7%
.0%
36.7%
4
计数
10
0
10
家庭人口中的%
100.0%
.0%
100.0%
汽车保有量中的%
35.7%
.0%
33.3%
总数的%
33.3%
.0%
33.3%
合计
计数
28
2
30
家庭人口中的%
93.3%
6.7%
100.0%
汽车保有量中的%
100.0%
100.0%
100.0%
总数的%
93.3%
6.7%
100.0%
分析上表:
汽车保有量为1占到样本的93.3%,保有量为2占到6.7%。
家庭人口增多,对汽车拥有需求越强,但是在汽车保有量为2的情况下,由于样本数量有限,导致家庭人口数为3、4的家庭反而没有增加汽车拥有量。
实验二:
均值过程、t检验、非参数检验和方差分析
一、实验目的:
理解参数检验的基本原理,能用SPSS软件对样本进行检验,熟练掌握实验步骤,并能对样本是否来自均值不同的总体判别。
二、实验平台:
PC机,WindowsXP/2000及以上操作系统,SPSS软件。
3、实验内容和步骤:
1均值过程和t检验
(1)均值过程分析
分析2-1.sav中的数据资料
(2)单一样本t检验
甲厂用A钢生产一种钢筋的强度X服从正态分布,已知
现在改变炼钢的配方,利用新法炼了10炉钢,从由它生产的钢筋中每炉随机抽取一根,测量得到每根的强度为:
53.21,49.78,57.32,52.33,50.01,54.55,53.78,52.44,55.11,53.32,试分析用新法炼钢后钢筋的强度是否提高?
(数据文件06-01.sav)
(3)独立样本t检验
某一橡胶配方中,原用氧化锌5g,现减为1g,用这两种配方作一批试验,测得橡胶伸长率数据在数据文件06-05.sav中,问:
这两种配方伸长率的总体均值间有无显著性差异?
(4)配对样本t检验
测得9名自行车运动员在正常情况下和在附加容量为0.5千克筒形呼吸死区的情况下,他们在自行车测功计上工作时的每分钟呼吸量数据见数据文件06-07.sav中,问:
在这两种不同情况下他们在自行车测功机上工作时的每分钟呼吸量是否有差异?
2非参数检验
(1)卡方检验
打开文件“卡方检验2.sav”,当样本数目发生改变时,总样本变到600人,其中选择美观轻便型的有246人,选择经济耐用型的有152人,选择速度型的有202人,调整个案的数值,判断三种款型中是否有一种受欢迎程度显著地高于其他两种。
(2)两独立样本检验
为比较两种型号的汽车每加仑汽油的行驶里程,随机从每个型号的汽车中各抽取12辆汽车,并让每辆汽车高速行驶1000英里,得到每辆汽车每加仑汽油行驶里程数据见数据文件07-13.sav,试分析两种型号汽车每加仑汽油的行驶里程是否相同。
(3)两相关样本检验
某学校某年级有441名学生,在市场营销调研课上,期中考试有381人及格,60人不及格;期末考试有367人及格,74人不及格。
具体情况见数据文件07-22.sav,试用McNemar法检验期中考试和期末考试及格的比例是否相同。
3方差分析
单因素方差分析(文件:
单因素方差分析)
为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同企业作为样本。
分析四个行业之间的服务质量是否有显著差异?
(α=0.05)
4、实验结果
(1)均值过程分析
报告
投保人性别
投保人年龄
过去5年的事故数
投保人年龄段
男
均值
41.62
1.98
2.65
N
250
250
250
标准差
9.345
1.608
.902
极小值
22
0
30岁以下
极大值
68
7
50岁以上
方差
87.338
2.586
.814
女
均值
41.79
1.47
2.68
N
250
250
250
标准差
9.204
1.412
.918
极小值
22
0
30岁以下
极大值
64
6
50岁以上
方差
84.706
1.993
.844
总计
均值
41.70
1.72
2.67
N
500
500
500
标准差
9.266
1.533
.910
极小值
22
0
30岁以下
极大值
68
7
50岁以上
方差
85.857
2.349
.827
通过性别变量来区别不同年龄段的投保人的情况。
男性过去五年平均事故数为1.98,女性为1.47.男性投保平均年龄为41.62,女性为41.79.男性过去五年事故数的方差2.586>女性过去五年事故数方差1.993,说明男性发生事故的波动性较大,不稳定性高于女性。
(2)单一样本t检验
单个样本检验
检验值=52
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
强度
1.712
9
.121
1.20700
-.3878
2.8018
根据上面的表格可以知道,
,所以不显著,不能证明用新法炼钢后钢筋的强度提高了。
(3)独立样本t检验
独立样本检验
方差方程的Levene检验
均值方程的t检验
差分的95%置信区间
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
橡胶伸长率
假设方差相等
2.517
.131
-5.008
17
.000
-28.68889
5.72846
-40.77488
-16.60290
假设方差不相等
-5.171
13.806
.000
-28.68889
5.54798
-40.60381
-16.77397
假设方差相等的情况下,
,所以可以判定这两种配方伸长率的总体均值间无显著性差异。
(4)配对样本t检验
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
正常-附加
-6.77778
8.08977
2.69659
-12.99613
-.55943
-2.513
8
.036
由结果可知:
两个样本的配对均值为-6.77778,t统计量为-2.513,对应的
,所以拒绝原假设。
可以认为在这两种不同情况下他们在自行车测功机上工作时的每分钟呼吸量是有差异的。
2非参数检验
(1)卡方检验
检验统计量
新型山地车
人数
卡方
216.472a
216.472a
df
2
2
渐近显著性
.000
.000
a.0个单元(.0%)具有小于5的期望频率。
单元最小期望频率为89.0。
新型山地车
观察数
期望数
残差
美观轻便
40
89.0
-49.0
经济耐用
25
89.0
-64.0
速度型
202
89.0
113.0
总数
267
新型山地车
观察数
期望数
残差
美观轻便
246
200.0
46.0
经济耐用
152
200.0
-48.0
速度型
202
200.0
2.0
总数
600
检验统计量
新型山地车
人数
卡方
22.120a
22.120a
df
2
2
渐近显著性
.000
.000
a.0个单元(.0%)具有小于5的期望频率。
单元最小期望频率为200.0。
由上图可知,在总体样本数267的前提下,
,拒绝原假设。
三种款型中是有一种受欢迎程度显著地高于其他两种。
但是无法断哪一种较为明显。
但是当样本容量变为600时,
,拒绝原假设。
三种而且美观轻便型山地车受欢迎程度存在明显差异,其中美观轻便型受欢迎程度明显高于其它两类。
这说明,随着生活水平的提高,,人们物质生活水平的提高,人们把追求美提高到了一个档次;同时在繁闹大都市,“轻便省力”也是人们首选的一个考虑因素。
针对这种情况,该企业应该着重在城市开发美观轻便型产品。
(2)两独立样本检验
检验统计量b
行驶里程
Mann-WhitneyU
32.500
WilcoxonW
110.500
Z
-2.282
渐近显著性(双侧)
.023
精确显著性[2*(单侧显著性)]
.020a
a.没有对结进行修正。
b.分组变量:
型号
(3)两个相关样本检验
期中考试情况&期末考试情况
期中考试情况
期末考试情况
不合格
合格
不合格
22
38
合格
52
329
检验统计量b
期中考试情况&期末考试情况
N
441
卡方a
1.878
渐近显著性
.171
a.连续性已修正
b.McNemar检验
结果如上图所示:
,
,所以不决绝原假设,期中考试和期末考试及格的比例是相同的。
3方差分析
单因素方差分析
方差齐性检验
投诉次数
Levene统计量
df1
df2
显著性
.195
3
19
.898
ANOVA
投诉次数
平方和
df
均方
F
显著性
组间
1456.609
3
485.536
3.407
.039
组内
2708.000
19
142.526
总数
4164.609
22
首先进行方差齐性检验,,说明接受原假设,可以进行方差检验。
由方差分析表可知,
,拒绝原假设,所致可以看出四个行业之间的服务质量有显著差异。
其中家电业被投诉的次数较多。
所以家电行业需要,和客户进行良好的沟通,解决这些矛盾。
实验三:
相关分析
一、实验目的:
理解相关分析的基本原理,学习掌握两变量相关分析,偏相关分析。
二、实验平台:
PC机,WindowsXP/2000及以上操作系统,SPSS软件。
3、实验内容和步骤:
1相关分析
(1)简单相关分析
在考察弹簧质量系统中,做过这样一个试验,将不同质量的重物置于垂直悬挂着的弹簧末端,记录弹簧对应不同重物质量下被拉长的长度,详细数据见数据文件10-01.sav,试分析弹簧伸长与重物质量质量之间是否存在线性相关关系。
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
质量
.090
11
.200*
.968
11
.870
弹簧拉长长度
.090
11
.200*
.973
11
.913
a.Lilliefors显著水平修正
*.这是真实显著水平的下限。
由上表可知质量和弹簧长度数据分布符合正态分布,可以进行相关分析。
(2)偏相关分析(文件:
偏相关)
分析研究在控制IQ情况下,12名学生的语文成绩和数学成绩的相关关系。
四、实验结果
(1)简单相关分析
在考察弹簧质量系统中,做过这样一个试验,将不同质量的重物置于垂直悬挂着的弹簧末端,记录弹簧对应不同重物质量下被拉长的长度,详细数据见数据文件10-01.sav,试分析弹簧伸长与重物质量质量之间是否存在线性相关关系。
相关性
质量
弹簧拉长长度
质量
Pearson相关性
1
.999**
显著性(双侧)
.000
N
11
11
弹簧拉长长度
Pearson相关性
.999**
1
显著性(双侧)
.000
N
11
11
**.在.01水平(双侧)上显著相关。
由上表可得:
质量和弹簧在某种程度上呈现十分显著的正相关性,也就是质量增加,弹簧长度会显著增加。
(2)偏相关分析(文件:
偏相关)
分析研究在控制IQ情况下,12名学生的语文成绩和数学成绩的相关关系。
相关性
控制变量
语文成绩
数学成绩
IQ
语文成绩
相关性
1.000
.893
显著性(双侧)
.
.000
df
0
9
数学成绩
相关性
.893
1.000
显著性(双侧)
.000
.
df
9
0
由该表可以知道,在控制IQ的情况下,语文成绩和数学成绩之间存在显著的相关性,
,显著相关,而且由表可知二者相关系数为0.893。
实验四:
回归分析
一、实验目的:
理解回归分析的基本原理,掌握对变量进行简单线性回归和多元回归的方法。
二、实验平台:
PC机,WindowsXP/2000及以上操作系统,SPSS软件。
3、实验内容和步骤:
回归分析
对原始资料进行数据录入(文件:
有关年收入、家庭成员人数和年信用卡支付数额的统计资料.doc)
数据录入结果
(1)简单线性回归
如何求信用卡支付数额对年收入的回归估计方程?
首先做出信用卡额度和年收入之间的散点图,观测二者是否具有明显的线性相关性,通过上图可以知道二者之间存在较为显著的线性关系。
(2)多元线性回归
如何求信用卡支付数额对年收入和家庭成员数的回归估计方程?
分别作出年收入和家庭成员数和信用卡额度之间的散点图,观察是否分别具有明显线性相关。
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
年收入
.086
25
.200*
.960
25
.416
家庭成员数
.179
25
.037
.910
25
.031
a.Lilliefors显著水平修正
*.这是真实显著水平的下限。
上表是数据是否符合正态分布检验。
可以知道年收入数据符合正态分布条件,因为
。
家庭成员数显著性水平不高,故不符合正态分布条件。
所以决定通过分参数样本来检验是否符合正态分布。
单样本Kolmogorov-Smirnov检验
家庭成员数
N
25
正态参数a,,b
均值
3.36
标准差
1.800
最极端差别