原创SPSS基于聚类分析和因子分析的学生在线购物行为研究论文报告Word下载.docx
《原创SPSS基于聚类分析和因子分析的学生在线购物行为研究论文报告Word下载.docx》由会员分享,可在线阅读,更多相关《原创SPSS基于聚类分析和因子分析的学生在线购物行为研究论文报告Word下载.docx(32页珍藏版)》请在冰豆网上搜索。
17
8.2
4000-5000元
7
3.4
5000元以上
15
7.2
从表格来看,我们可以发现生活费在五千元以上的人有十五个人占比7.2%,月生活费在四千元到五千元,有七个人占比3.4%。
生活费在两千元到三千元的人有55个占比26.6%。
然后我们察看被调查者每月的网购频率
从图中我们可以看到网购频率在3到5次的人占绝大多数。
2次及以内
49
23.7
3-5次
88
42.5
6-8次
42
20.3
8次以上
从表格来看,我们可以发现网购频率在八次以上有28个人,占比13.5%。
网购频率在6到8次之间的人有42个,占比20.3%。
网络频率在3到5次的人有88个占比42.5。
信度分析
可靠性是指如果测量重复多次,则刻度产生一致结果的程度。
可靠性分析称为可靠性分析。
可靠性分析是通过获得规模中系统变异的比例来确定的,这可以通过确定从不同的规模管理获得的分数之间的关联来进行。
因此,如果可靠性分析中的关联度较高,则规模产生一致的结果,因此是可靠的。
可靠性统计量
Cronbach'
sAlpha
基于标准化项的CronbachsAlpha
项数
.852
.882
一般来说,我们认为信度系数在0.8左右,较好的可信程度。
从结果中我们可以看到系数在0.8左右,说明该调查有一定的可信度。
效度分析
有效性是概念,结论或测量是有根据的,与真实世界准确对应的程度。
“有效”一词来自拉丁语有效性,意思强。
测量工具的有效性(例如,在教育中的测试)被认为是工具衡量其所要衡量的程度;
在这种情况下,有效性等同于准确性。
检验变量是否适合于因子分析的常用方法是巴特利特球形检验)和检验。
本文生活方式量表的因子分析前提条件检验情况如表
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.621
Bartlett的球形度检验
近似卡方
3259.284
df
1485
Sig.
.000
表结果显示,球形度检验的近似卡方值为值为3259.28,小于说明原始矩阵不可能是单位阵,即原变量之间存在较高的相关性。
度量值为,综合以上两点的验证结果得出本问卷的数据适合做因子分析。
因子分析
因子分析是通过解释变量之间的相关性来解释数据结构的方法。
它通常用于社会科学,市场研究和其他使用大数据集的行业。
因子分析是一种用于根据较少数量的潜在不可观察(潜在)“因素”对观察变量及其协方差结构进行建模的方法。
这些因素通常被视为可能描述观察现象的广泛概念或观点。
例如,获得一定社会水平的基本愿望可能解释了大部分的消费行为。
这些不可观察的因素对社会科学家比观察到的定量测量更有趣。
因子分析通常是一种探索性/描述性的方法,需要用户许多主观判断。
它是一个广泛使用的工具,但可能是有争议的,因为模型,方法和主观性是如此灵活,可以发生关于解释的辩论。
该方法与主要组成部分相似,尽管教科书指出,因素分析更为精细。
在某种意义上,因子分析是主成分的反演。
在因子分析中,我们将观察到的变量建模为“因子”的线性函数。
在主成分中,我们创建新变量,这些变量是观察变量的线性组合。
但是在PCA和FA维度的数据都有所减少。
回想一下,在PCA中主要组成部分的解释往往不是很干净。
有时候,特定的变量可以显着地贡献于多于一个的组件。
理想情况下,我们喜欢每个变量只对一个组件作出重大贡献。
针对该目标采用称为因子旋转的技术。
涉及因素分析的领域的例子包括生理学,健康,智力,社会学,有时是生态学和其他领域。
为了使变量更好地适应因子分析的前提,我们需要根据调查结果净化初始变量。
常用的测量是变量的通用性(公因子方差),即单项对整体方差的贡献。
一般来说,需要初始变量来删除与变量不常用的变量,下一步是提取具有大于原始变量的变量共同性的因子。
公因子方差
初始
提取
您的性别
1.000
.769
您的年级
.670
您的月生活费大约是
.690
您每月网购频率
.608
您的购物网站获知渠道(朋友介绍)
.659
您的购物网站获知渠道(网络广告)
.546
您的购物网站获知渠道(电视广告)
.599
您的购物网站获知渠道(电台广告)
.719
您的购物网站获知渠道(报刊广告)
.650
您的购物网站获知渠道(上网浏览)
.746
您常用的购物网站(淘宝)
.629
您常用的购物网站(聚美优品)
.662
您常用的购物网站(京东)
.579
您常用的购物网站(当当网)
.623
您常用的购物网站(亚马逊)
.684
您常用的购物网站(闲鱼)
.529
您常用的购物网站(唯品会)
.585
您常用的购物网站(苏宁易购)
.595
您常用的购物网站(我买网)
.611
您常用的购物网站(聚划算)
.612
您每月网络购物的消费
.757
您网购的资金来源(父母家庭)
.718
您网购的资金来源(兼职零工)
.668
您网购的资金来源(生活补助)
.617
您网购的资金来源(奖学金)
.660
您选择网购的原因(方便快捷)
.689
您选择网购的原因(时尚潮流)
.586
您选择网购的原因(价格便宜)
.681
您选择网购的原因(多选择性)
.590
您选择网购的原因(商品更新快)
.643
您通常网购商品类型(学习用品)
.655
您通常网购商品类型(服装服饰)
.450
您通常网购商品类型(化妆品)
.700
您通常网购商品类型(电子产品)
您通常网购商品类型(虚拟产品)
.733
您通常网购商品类型(食品保健品)
.649
您通常网购商品类型(体育用品)
.635
您通常网购商品类型(购票)
.553
您对网购担心的问题(付款安全性)
.533
您对网购担心的问题(网站诚信)
.637
您对网购担心的问题(商品质量)
.665
您对网购担心的问题(售后服务)
.698
您对网购担心的问题(配送问题)
.709
您对网购担心的问题(个人隐私泄露)
.583
您通常对网购问题的解决方式
.720
13、生活方式问题(喜欢和同学一起出去活动)
13、生活方式问题(追求时尚新颖的产品)
.707
13、生活方式问题(会货比三家)
13、生活方式问题(有风险的事情就不愿意做)
.539
13、生活方式问题(喜欢结实各类型朋友)
13、生活方式问题(愿意购买广告广泛宣传产品)
.627
13、生活方式问题(喜欢购买便宜打折产品)
.674
13、生活方式问题(喜欢将来有份稳定工作,尽管收入不高)
13、生活方式问题(流行和实用之间我选择流行)
.652
13、生活方式问题(花钱有计划性)
.642
提取方法:
主成份分析。
通过上述分析,使用主成分分析提取因子,最大旋转因子的方差为了得到上述因子负荷量表,根据提取标准,提取大于因子负荷的特征值绝对值大于该因子。
这个比例从问题的问题中删除“您通常网购商品类型(服装服饰)的问题”保持负载值大于0.5问题。
因素的数量通常使用指数或特征值来确定。
指数或特征值方法给出各个阶段的因子分析特征的根和方差贡献表,其中包括初始特征值,提取平方和负载,其中旋转正方形和负载,初始特征值列给出了初始样本相关系数矩阵或协方差矩阵的特征根,用于确定哪些因素应提取;
提取正方形和负载列给出提取的因子方差贡献率,旋转后提取的共同因子的方差贡献因子由因子的数量给出特征值是一个二维空间图,可以更直观地显示每个因子的分布。
解释的总方差
成份
初始特征值
提取平方和载入
方差的%
累积%
1
4.230
7.691
2
3.771
6.856
14.547
3
3.562
6.477
21.024
4
2.713
4.933
25.957
5
2.526
4.593
30.550
6
1.981
3.601
34.151
1.789
3.253
37.404
8
1.708
3.106
40.510
9
1.587
2.886
43.396
10
1.528
2.777
46.173
11
1.429
2.599
48.772
12
1.396
2.538
51.310
13
1.331
2.420
53.730
14
1.296
2.356
56.087
1.219
2.216
58.302
16
1.137
2.067
60.369
1.095
1.992
62.361
18
1.046
1.901
64.263
19
.999
1.816
66.078
20
.968
1.760
67.838
21
.951
1.728
69.567
22
.897
1.630
71.197
.870
1.581
72.779
24
.847
1.540
74.319
25
.802
1.458
75.777
26
.776
1.411
77.187
27
.749
1.362
78.549
.727
1.322
79.871
29
1.273
81.144
30
.673
1.223
82.367
31
.620
1.127
83.495
32
.602
1.094
84.589
33
1.074
85.662
34
.566
1.028
86.691
35
.538
.979
87.669
.531
.966
88.635
.498
.905
89.541
38
.475
.865
90.405
39
.474
.862
91.267
40
.447
.813
92.080
41
.429
.780
92.860
.407
.740
93.600
43
.395
94.318
44
.349
.634
94.952
45
.333
.605
95.558
46
.312
.567
96.125
47
.295
.537
96.662
48
.282
.512
97.174
.273
.496
97.671
50
.270
.491
98.162
51
.243
.443
98.604
52
.220
.400
99.004
53
.212
.385
99.389
54
.172
99.701
.164
.299
100.000
从上面的图可以看出,在第6个因子曲线出现明显的顶点,在第6个因子之前的曲线非常陡峭,而在第七个因子之后的曲线趋于平缓。
在特征根和方差贡献表中,第一个常用因子解释变量的总方差,第二个共同因素解释变量的总方差第三个常见因素解释变量的总方差,第四个共同因素解释变量总方差的第五个共同因素解释变量总方差的第六个方差公开因素解释变量的总方差,累积贡献率,6个因子可以是变量信息的良好代表。
主成分分析中,由该因素的最高负荷变量的数量减少以得到最终因素,如下表所示:
成份矩阵a
.239
-.067
-.095
.258
-.155
-.305
.077
.179
.075
.268
.387
-.070
-.068
.162
-.231
-.014
.205
-.033
.271
.476
-.198
-.177
-.145
-.063
-.130
.035
-.086
.158
.607
-.050
-.290
.068
.006
-.134
.225
.066
.289
.419
-.036
-.144
.155
-.247
.092
.080
-.168
.206
-.242
.229
.133
.232
.097
-.355
-.115
-.319
.048
.331
-.182
-.042
.189
.235
-.022
.230
.436
.034
-.204
-.154
.131
.174
-.118
.036
.044
-.272
.141
.128
.375
.013
.182
.180
.063
.253
-.054
.108
.041
-.186
-.013
-.057
.079
.266
.473
-.094
-.325
.043
-.048
.317
.300
.071
-.175
.110
.040
-.017
.093
.296
.022
-.117
.124
-.114
.256
.344
-.149
.347
.102
.143
-.252
-.090
.082
-.135
-.021
-.059
.234
-.109
.260
.285
.163
.122
.320
-.157
-.266
.237
-.217
-.244
.369
-.040
-.053
.083
.137
.165
.130
.064
-.535
.146
.194
-.331
.325
-.087
.020
.099
-.076
.200
.302
.336
-.251
.039
.276
-.165
-.342
.100
.157
.448
.054
-.459
.060
-.246
-.453
-.075
.357
-.205
.148
.560
.170
-.263
-.121
-.035
-.104
.062
.216
.117
.188
-.262
.218
-.241
.086
.415
-.106
.186
.217
.078
.126
.654
.264
.033
.047
.026
-.062
-.012
.132
.107
.197
-.128
.350
-.320
-.032
-.236
.326
.324
-.170
.113
.010
-.219
.418
.183
.522
-.089
-.360
-.102
-.078
.091
.105
.070
.119
.101
-.011
.160
-.028
-.009
.486
-.010
.049
.150
.319
.051
.193
.069
.169
.081
.094
.140
-.353
-.151
.411
-.377
.338
.016
.421
.050
.277
.275
-.250
.