校园卡日常餐费支出情况分析统计.docx
《校园卡日常餐费支出情况分析统计.docx》由会员分享,可在线阅读,更多相关《校园卡日常餐费支出情况分析统计.docx(39页珍藏版)》请在冰豆网上搜索。
校园卡日常餐费支出情况分析统计
校园卡日常餐费支出情况分析统计
摘要
校园卡为广大的师生提供了很多便利,所谓“一卡在手,走遍校园”,校园卡已成为大学生在校园消费的主要凭证,一张校园卡每天要被刷若干次,例如,餐费支出,终端存款,洗衣支出,用电支出,余额转结,购物支出等。
本文以某校某时段100万条校园卡消费操作记录为研究对象,本文利用SPSS软件和Excel软件,随机选取500条校园卡一次性餐费支出数据,对餐费支出数额进行数据进行整理分类、分析和处理,,建立聚类分析模型,探讨校园卡餐费支出特点,找出消费集中数额,对大学生餐费支出情况做出评价。
关键词:
校园卡餐费支出;聚类分析;SPSS软件;
1.问题重述
校园卡已成为广大师生日常生活中的必备品,尤其是用于餐费支出,由于一次用餐可能需要若干次刷卡,而且每人刷卡的次数与金额不等,但是金额数量主要集中在某一数额范围内。
本文以某校某时段100万条校园卡消费操作记录为研究对象,本文利用SPSS软件和Excel软件,随机选取500条校园卡一次性餐费支出数据,对餐费支出数额进行数据进行整理分类、分析和处理,,建立聚类分析模型,探讨校园卡餐费支出特点,找出消费集中数额,以及刷卡次数分类,对大学生餐费支出情况做出评价。
已知资料
附件1:
前100万条消费数据(鉴于数据信息量大,文中不在给出)
附件2:
500条样本餐费消费数据
2.问题分析
首先,先分析题目中所给的数据,发现在这些数据中出现有些无效数据,所以对该类数据在统计之前视为无效数据,将其剔除,然后再求解所有问题。
求解该问题时用Excel软件对其做数值统计处理,然后处理后的数据用SPSS软件中的相关函数对其进行处理,结合Excel与Matlab软件画图分析,最终对相关的问题做出结论。
为了研究校园卡餐费支出情况,本文随机抽取500条校园卡餐费支出数据进行分类研究,以餐费支出为研究对象,利用SPSS软件做聚类分析,找出一次刷卡餐费支出的集中数额,以及刷卡次数分类,对大学生餐费支出情况做出评价。
3.模型假设
(1)假设该校所有原始数据来源真实可靠;
(2)假设题目所给数据能有效反映该校学生校园卡餐费支出消费情况;
(3)假设数据经过微处理后对原始的结果影响并不大;
(4)假设500条消费记录是随机抽取的,能反映一天校园卡餐费支出情况;
(5)假设只要刷卡一次,就算一次餐费支出;
(6)假设餐费支出排除其他外界因素影响,如不同餐厅,用餐时段,菜品价格等因素;
(7)假设不对学生卡号进行区分,一张卡多次消费按次数记,即只按消费记录进行分类。
4.符号说明
符号
说明
比例系数,
z
餐费支出金额
刷卡次数
样本点
的马氏距离
包含聚类对象全体的集合
描述聚类对象特征的向量
样本距离矩阵
5.模型建立与求解
5.1模型原理
聚类分析是依据研究对象的个体特征,对其进行分类的方法,分类在经济、管理、社会学、医学等领域,都有广泛的应用。
聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。
类别内部个体特征之间具有相似性,不同类别间个体特征的差异性较大。
聚类分析:
是研究样品(或指标)分类问题的一种多元统计法。
主要方法:
系统聚类法,有序样品聚类法,动态聚类法,模糊聚类法,图论聚类法,聚类预报法等。
系统聚类法的基本原理:
首先将一定数量的样本或指标各自看成一类,然后根据样本(或指标)的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。
重复这一过程,直到将所有的样本(或指标)合并为一类。
系统聚类分为Q型聚类和R型聚类两种:
Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数、降低变量维度的目的。
快速聚类分析的基本思想是:
首先按照一定方法选取一批凝聚点(聚心),再让样本向最近的凝聚点凝聚,形成初始分类,然后再按最近距离原则修改不合理的分类,直到合理为止。
因此,在快速聚类中,应首先要求用户自行给出需要聚成多少类,最终也只能输出关于它的唯一解。
快速聚类是一个反复迭代的分类过程,在聚类过程中,样本所属的类会不断调整,直到最终达到稳定为止。
5.2模型建立与求解
根据事物本身的特性研究个体分类的方法,原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。
根据分类对象的不同,分为样品聚类和变量聚类两种。
样品聚类是对观测量进行聚类(不同的目的选用不同的指标作为分类的依据);变量聚类是找出彼此独立且有代表性的自变量,而又不丢失大部分信息。
对于题目中给出了500条随机餐费支出消费记录,对抽样的样本进行分类,因此用样品聚类,建立了聚类分析模型,对不同消费情况进行分类。
设
是待分类的对象的全体,
称为
的特征向量,其中的每个参数用来刻画
的某个特征。
按照各样本间的近似关系把
划分成多个不相交的子集
,并要求满足下列条件:
求解模型时,首先对需要聚类的数据进行归一化处理,以消除量纲的影响,再求样本点之间的距离,得到距离矩阵D,最后通过系统聚类法得到分类结果。
本文使用极差标准化将数据处理到0-1之间,使用欧氏距离法求得距离矩阵D,由于本文强调类别的差异性,故采用系统聚类法中的离差平方和法,使同类样品的离差平方和较小,类与类之间较大。
5.2.1刷卡次数分类
按照刷卡次数第一层的标准,对用户进行分类。
运用聚类分析模型,用SPSS软件将刷卡次数三个用户群:
第一类刷卡次数为2次,第二类刷卡次数为3次,第三类刷卡次数为4次,第四类刷卡次数为5次以上。
根据聚类对刷卡次数的分类(见附录中表2),统计每个用户群的用户人数,绘制出柱状图,如图1所示:
图1:
刷卡次数分布柱状图
图2:
刷卡次数分布散点图
由图1,图2可知,刷卡次数主要集中在2次。
5.2.1餐费消费支出分类
按照餐费消费支出第二层的标准,对用户进行分类。
运用聚类分析模型,用SPSS软件将餐费消费支出分为三个用户群:
第一类餐费消费支出0-2.0,第二类餐费消费支出2.1-5.0,第三类餐费消费支出5.0-10.0。
根据聚类对用户的分类(见附录中表2),统计校园卡餐费消费支出情况,绘制出柱状图,如图2所示:
图3:
校园卡餐费消费支出情况柱状图
图4:
校园卡餐费消费支出情况折线图
由图3,图4可知,校园卡三类消费数额的消费人数相对均衡,主要集中在第二类。
5.3模型结果分析
通过建立上述模型,可以得出如下结论:
根据随机选取的500条校园卡消费记录进行统计分析,人均刷卡次数集中在2次,而餐费支出情况主要集中在2.1-5.0。
5.4模型不足
(1)由于模型选取的数据相对较少,有些分类的标准只能主观定义;
(2)在模型的建立中,只考虑了刷卡次数和餐费支出客观因素,忽略了其他因素的影响,使得结果存在一些误差,
(3)为了使问题简化,在模型建立时,做了一些假设,可能导致模型比较简单,与实际情况有所偏差。
参考文献
[1]傅景广,许刚,王裕国.基于遗传算法的聚类分析[J].计算机工程,2004,30(4):
122-124.
[2]张文彤,闫洁.SPSS统计分析基础教程[J].北京:
高等教育版社,2004:
335-340.
[3]朱道元,陈鼎兴,张学仁.数学建模[J].2003.
[4]邬学军,周凯,宋军全.数学建模竞赛辅导教程.杭州浙江大学出版社2009年8月
附件2500条样本餐费消费数据
USTOMERID
SUMFARE
OPCOUNT
OPFARE
DSCRP
1245771
35.8
2
3.7
餐费支出
1190029
30.55
2
8
餐费支出
1273122
55.73
3
3.7
餐费支出
1250886
150
3
0.8
餐费支出
1250974
76.5
2
5.1
餐费支出
1282166
81
2
5.5
餐费支出
1189566
44.84
4
6.2
餐费支出
1245768
78.47
2
3.2
餐费支出
1282382
117
3
7.7
餐费支出
1259481
27.6
3
1
餐费支出
1282449
10.8
3
8
餐费支出
1189530
150.22
3
5
餐费支出
1250887
54.67
5
0.5
餐费支出
1273300
26.49
2
7
餐费支出
1250873
60.6
4
8.5
餐费支出
1188679
39.62
2
4
餐费支出
1273380
28
3
4.5
餐费支出
1273283
39.62
4
0.8
餐费支出
1245768
78.47
3
1
餐费支出
1189572
82.86
2
7.7
餐费支出
1282382
117
4
1
餐费支出
1191825
64.7
2
7.6
餐费支出
1250955
58.1
3
7.5
餐费支出
1250904
34.05
2
6
餐费支出
1247321
38.51
2
4.2
餐费支出
1250950
90.98
2
5.7
餐费支出
1190029
30.55
3
1
餐费支出
1186689
38.2
3
1
餐费支出
1191396
112.12
4
1
餐费支出
1282422
16.6
3
7.5
餐费支出
1189530
150.22
4
1
餐费支出
1189434
285.75
3
1
餐费支出
1250950
90.98
3
5
餐费支出
1191433
63.58
3
5.4
餐费支出
1273293
88.4
2
8
餐费支出
1282448
54.98
3
8.5
餐费支出
1191827
12.2
2
7.4
餐费支出
1187146
60.21
3
5.2
餐费支出
1189711
105.85
3
0.8
餐费支出
1282420
41.05
5
4.5
餐费支出
1282421
41
3
8
餐费支出
1134532
128.88
2
7.4
餐费支出
1260266
17.9
3
4.2
餐费支出
1189585
46.12
3
5.5
餐费支出
1246470
11.33
2
6.7
餐费支出
1273189
93.6
3
1
餐费支出
1282440
45.5
3
7.2
餐费支出
1191534
58.58
3
3.9
餐费支出
1267597
34.1
2
6.2
餐费支出
1191534
58.58
4
0.8
餐费支出
1282527
32
3
0.5
餐费支出
1189433
135.7
2
3
餐费支出
1267592
60.32
3
1
餐费支出
1189456
83.32
2
4.7
餐费支出
1273196
13.3
2
4.2
餐费支出
1191836
82.68
3
5.9
餐费支出
1245615
23.65
2
6.2
餐费支出
1244899
23.11
2
4
餐费支出
1067246
123.15
2
6.5
餐费支出
1282523
36.6
2
9.5
餐费支出
1250971
40.4
2
5.4
餐费支出
1246421
21.73
4
0.8
餐费支出
1250852
113.98
4
6.5
餐费支出
1186883
16.9
3
6
餐费支出
1250858
41.82
2
5.7
餐费支出
1189440
128.65
3
1
餐费支出
1248974
76.44
3
2
餐费支出
1269791
25.17
3
1
餐费支出
1273174
72.7
2
6.9
餐费支出
1282164
27.5
2
6
餐费支出
1190549
69.64
2
7.2
餐费支出
1273180
215.2
4
5.7
餐费支出
1245664
136.2
3
7.7
餐费支出
1067246
123.15
3
1
餐费支出
1190241
22.01
3
1
餐费支出
1250861
65.04
2
3
餐费支出
1273436
278.3
3
9.5
餐费支出
1266837
17.93
2
3.7
餐费支出
1250861
65.04
3
0.4
餐费支出
1273436
278.3
4
1
餐费支出
1191885
58.2
3
6.2
餐费支出
1190009
38.81
3
6
餐费支出
1191874
239.52
2
4.5
餐费支出
1260254
35.1
2
5.5
餐费支出
1186683
24.6
4
1.5
餐费支出
1190387
57.23
4
5.7
餐费支出
1245997
27.3
2
8
餐费支出
1190549
69.64
3
1
餐费支出
1191823
86.65
2
6.2
餐费支出
1245615
23.65
3
1
餐费支出
1282163
78
2
8
餐费支出
1273318
21.82
3
4.5
餐费支出
1189864
31.07
4
1
餐费支出
1247202
38.45
3
6.2
餐费支出
1192013
83.6
2
5.6
餐费支出
1270698
121
2
4.7
餐费支出
1191879
125.57
2
3.7
餐费支出
1273174
72.7
3
0.8
餐费支出
1282456
78.1
2
7.5
餐费支出
1189103
58.34
2
6.2
餐费支出
1246710
50.67
3
5.1
餐费支出
1273279
62.07
2
3.7
餐费支出
1273352
17.48
2
5.4
餐费支出
1245847
54.3
4
0.8
餐费支出
1267793
68.1
3
4.9
餐费支出
1189603
140.52
2
6.7
餐费支出
1189587
102.47
3
5.2
餐费支出
1187545
55.6
4
3
餐费支出
1188793
86.99
7
5.5
餐费支出
1281723
33.66
2
1
餐费支出
1192254
88.81
3
6.4
餐费支出
1245849
36.4
2
7
餐费支出
1192277
67.62
3
1
餐费支出
1250838
112.46
6
6.2
餐费支出
1281722
50.1
3
8
餐费支出
1281723
33.66
3
5
餐费支出
1246304
99.3
3
1.5
餐费支出
1273278
11.18
2
5.2
餐费支出
1188956
94.67
3
3.5
餐费支出
1187683
41.5
2
5.4
餐费支出
1191538
60.45
3
7.1
餐费支出
1190233
55.9
3
1
餐费支出
1190784
36.2
2
3.7
餐费支出
1189863
72.65
3
6.5
餐费支出
1190362
53.44
3
7.2
餐费支出
1250930
40.5
2
5.1
餐费支出
1250956
12.18
3
5
餐费支出
1192254
88.81
4
0.8
餐费支出
1079258
44.85
3
6
餐费支出
1192354
156.12
3
5
餐费支出
1052685
70.8
3
9.9
餐费支出
1052685
70.8
4
5.5
餐费支出
1190784
36.2
3
1.2
餐费支出
1188234
37.69
2
5
餐费支出
1243098
69.19
3
4.7
餐费支出
1191278
105.31
2
7.2
餐费支出
1187719
87.13
2
6.6
餐费支出
1189587
102.47
4
1
餐费支出
1248433
59.03
3
6.2
餐费支出
1186758
19.9
3
2.2
餐费支出
1273278
11.18
3
0.8
餐费支出
1250954
34.5
3
5.2
餐费支出
1189230
30.9
2
0.7
餐费支出
1247549
19.52
2
8.2
餐费支出
1191858
94.61
2
5.7
餐费支出
1186758
19.9
4
2.5
餐费支出
1188793
86.99
8
5
餐费支出
1201673
47.4
2
4
餐费支出
1189923
47
2
4.2
餐费支出
1089043
15.61
2
2.5
餐费支出
1246887
20.48
2
2.5
餐费支出
1246888
3.94
2
2.5
餐费支出
1201673
47.4
3
3.4
餐费支出
1201673
47.4
4
3.4
餐费支出
1189485
224.02
2
2.2
餐费支出
1270910
232.01
2
1
餐费支出
1190568
33.41
2
4.5
餐费支出
1190567
74.48
2
3
餐费支出
1189585
46.12
2
2.3
餐费支出
1250939
37.3
2
1.7
餐费支出
1190296
34
3
0.7
餐费支出
1260210
26.9
4
9.7
餐费支出
1190463
3.01
2
2.7
餐费支出
1260210
26.9
5
1
餐费支出
1243415
23.97
2
2.5
餐费支出
1187274
144.75
2
2.8
餐费支出
1201673
47.4
5
1.5
餐费支出
1260137
20.2
2
2.1
餐费支出
1190252
69.56
2
3.2
餐费支出
1188936
145.51
2
1.5
餐费支出
1091905
58.88
2
3.1
餐费支出
1268572
253.59
2
1.5
餐费支出
1190923
74.1
2
3
餐费支出
1191384
269.82
2
2.7
餐费支出
1192330
92.87
2
2.5
餐费支出
1189566
44.84
3
3.5
餐费支出
1186846
36.5
3
2.5
餐费支出
1190918
46.8
2
3.8
餐费支出
1191396
112.12
2
2.1
餐费支出
1247309
106.73
2
2.8
餐费支出
1186846
36.5
4
1.5
餐费支出
1247311
4.81
2
2.7
餐费支出
1190308
54.92
2
3.5
餐费支出
1282445
2.8
2
1.1
餐费支出
1273060
9.73
2
3.1
餐费支出
1273311
46.5
2
3.9
餐费支出
1189570
186.3
2
4.2
餐费支出
1191538
60.45
2
2.2
餐费支出
1189266
103.98
2
2
餐费支出
1247079
12.3
2
1.8
餐费支出
1189138
73.49
2
2
餐费支出
1273075
86.3
2
3.1
餐费支出
1247737
118.05
2
2.5
餐费支出
1273083
45.2
2
2.5
餐费支出
1247737
118.05
3
2.5
餐费支出
1244880
12.29
2
2.8
餐费支出
1186687
30.5
2
3.6
餐费支出
1250887
4.67
2
2
餐费支出
1190510
84
2
1
餐费支出
1190611
11
2
2.8
餐费支出
1190508
32.67
2
3.5
餐费支出
1260210
26.9
3
5.5
餐费支出
1245148
14.3
2
1.5
餐费支出
1186975
19
2
3.5
餐费支出
1190071
41.93
2
2
餐费支出
1191739
95.35
2
1.5
餐费支出
1187242
33.28
2
2.7
餐费支出
1186883
16.9
2
3.5
餐费支出
1194193
63.24
2
3
餐费支出
1246591
22.53
2
3.7
餐费支出
1251040
39.68
2
3.7
餐费支出
1187258
235.2
3
2.7
餐费支出
1186957
8
2
2.5
餐费支出
1186846
36.5
2
2.1
餐费支出
1243457
75.1
2
2
餐费支出
1186993
16.3
2
3.5
餐费支出
1190296
34
2
3.5
餐费支出
1271560
13.8
2
2.7
餐费支出
1267978
26.75
2
2
餐费支出
1189830
5.6
2
3.7
餐费支出
1243454
67.44
2
1.1
餐费支出
1187761
40.41
2
1.1
餐费支出
1189014
41
2
3.6
餐费支出
1191887
20.3
2
3
餐费支出
1250902
16.65
2
3
餐费支出
1191815
65.05
2
0.5
餐费支出
1250902
16.65
3
1
餐费支出
1273204
202.6
2
3
餐费支出
1192012
69.71
2
1
餐费支出
1192012
69.71