18组王越胡冠宇吴尚益数模训练2网络购物分析最新文档资料.docx
《18组王越胡冠宇吴尚益数模训练2网络购物分析最新文档资料.docx》由会员分享,可在线阅读,更多相关《18组王越胡冠宇吴尚益数模训练2网络购物分析最新文档资料.docx(11页珍藏版)》请在冰豆网上搜索。
![18组王越胡冠宇吴尚益数模训练2网络购物分析最新文档资料.docx](https://file1.bdocx.com/fileroot1/2022-10/26/a6b48577-3078-47f8-9c36-e5e2bd1ee2f7/a6b48577-3078-47f8-9c36-e5e2bd1ee2f71.gif)
18组王越胡冠宇吴尚益数模训练2网络购物分析最新文档资料
2019年数模训练1
投资计划问题
组号:
18
成员:
王越胡冠宇吴尚益
目录
五、模型的建立8
八、附录19
2019年训练题1:
投资计划问题
摘要
本文通过matlab软件对网购销售数据进行了处理以及分析,解决了网购网站销售产品的问题。
由于本题中的数据量极其庞大,本文先通过excel对数据进行初步处理,然后运用matlab软件对数据进行了优化,得出了999件商品的0—1销售表。
0—1销售表为本文分析的基础数据,本文的相关数据分析均给予基于商品销售0-1销售表。
第一问中,本文基于关联规则对相关性进行了阀值分析,然后通过枚举法对本文的两两关联度进行了分析,同时挑出了其中关联度以及被购买数较多的数据进行了聚类分析得出了相应的相似度的有关结果。
第二问中,本文基于第一问的结果以及特征商品对多个商品直接的关联度进行了分析,同样的运用matlab软件对数据进行枚举分析,得出相关度较高的组别。
最后,在第三问中,本文选取了前两问关联度分析中的二维、三维以及四维数据对不同商品组合之间的利润进行了运算。
同时运用相应的评价规则对商品的可行促销方案进行了分析,得出了相应可行且利润较优的促销方案.
总体而言,本文通过matlab以及spss等数学统计软件运用关联规则以及穷举法解决了网购网站商品购买关联度以及促销的问题,在一定程度上为网购网站的经营提出了一定的方案。
一、问题重述
如今,“网购”已成为人们生活的一部分。
由此成就了一批优秀的购物网站,如天猫,京东,当当,亚马逊等。
在购物的同时,人们的购物记录被保留在网站数据库内。
网店老板经常关心的问题是顾客的购物习惯。
他们想知道:
“什么商品组或集合顾客会在一次购物时同时购买”。
他们可以把这些“同类商品”相互关联在网页内,以便于顾客浏览商品,引导顾客消费,进而增加销量。
已知某购物网站一段时期所有顾客购买物品的清单和相应商品的利润,需要你们给网店老板一个合理的顾客购物习惯分析报告,并提供一个促销计划的初步方案。
问题1附件1中的表格数据显示了该网站主要购物数据,一段时期内4625个顾客对999种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的网站内部编号。
试建立一种数学模型,该模型能定量表达网站中多种商品间的关联关系的密切程度。
问题2根据你们在问题1中建立的模型,寻找一种快速有效的方法能从附件1中数据分析出哪些商品是最频繁被同时购买的。
网站老板希望得到尽可能多的商品被频繁同时购买的信息,所以你们找到的最频繁被同时购买的商品数量越多越好。
例如:
如果商品1、商品2、商品3,商品4在4625个购物记录中同时出现了200次,则可以认为这三个商品同时频繁出现了200次,商品数量是4。
问题3附件2给出了这999中商品的对应的利润,试根据你们在问题1、问题2中建立的模型,给出一种初步的促销方案,使购物网站的效益进一步增大。
二、模型假设
1.题目给出的统计数据真实有效。
4.短时间内商品的销售情况不变。
3.表格中的数据能真实有效地反映当地消费者的购物情况。
2.问题三中,各个商品的利润保持不变。
三、符号说明:
(未列出符号将在文中进行进一步说明)
n
消费者的数量
人i是否购买了商品j。
1—购买0—未购买
对第i个消费者的消费行为的描述
第j种商品被n个消费者购买的情况
j、k两种商品的相关性(是对商品j和k有相同购买行为的消费者在总共n个消费者中所占的比例)
在购买了商品j和k中至少一种的消费者中,同时购买了两种产品的比例
=1-
差异性的距离度量
包含了p个不同的商品的第一小类
包含了另外q个不同商品的第二小类
小类AB之间的距离
四、问题分析
问题一:
问题一本质为商品分类问题,本题中我们设定的商品分类标准为其关联度属性。
本次试验,我们运用聚类分析与apriori算法相结合的方式,采用商品支持度来度量商品关联度。
进而定义商品类别之间的距离,从而进行分组聚类,描述商品的关联度。
问题二:
本题中,对问题一模型进行了简化和修改,利用穷举法对于两种商品组合、三种商品组合、四种商品组合购买人数进行筛选。
其中在三种和四种商品购买人数测定过程中,设计阀值,利用两种商品组合购买人数额分析结论,确定频繁项组,以此减少循环次数,保证程序的可执行性。
问题三:
利用商品组合方案,计算商品组合利润,寻求利润最大、销量最大的最优商品组合。
同时,结合单位商品利润,制定相关促销方案。
五、模型的建立
问题一:
基于0-1变量的聚类方法——apriori算法改良:
本题中,我们将购物篮中商品的相关性予以分析,并根据其相关性的大小予以聚类。
1、数据优化
我们关注于p种不同产品的相关性。
我们用向量描述第i个消费者某次购买行为。
其中,若第i位消费者购买第j种商品,记=1;否则=0。
若消费者总数为n,则定义向量刻画第j种商品被n个消费者购买的情况。
若由大量的1构成,j商品被消费者购买的频率很高。
为了刻画多种商品的关联度,我们定义支持度及信度
支持度:
表示对商品j和k有相同购买行为的消费者在消费者总数中的占比。
若值很大,说明商品j和k具有强相关性,应被聚为一类,否则说明相关性较弱。
信度描述消费者i购买j或k的前提下同时购买j、k商品的条件概率。
指标度量消费者一旦决定购买商品j或k后,购买j、k两种产品可能性的大小;若较大,则
j、k两种商品的相关性很大,应被聚为一类;否则这两种商品的相关性很小。
根据关联度的度量,定义距离=1-来获得关于差异性的距离度量,即相关性越大,距离越小。
上述的距离定义仅仅适用于两种具体的商品。
在分层聚类的过程中,距离最近的,相似性最强的商品被首先聚为个各“小类”。
在此基础上,再将相似的“小类”聚为“大类”。
本题中,我组采用平均链接法定义“类”与“类”之间的距离。
假设我们有两个“小类”,记为:
和。
即:
第一个“小类”中总共包含了p个不同的产品,而第二个“小类”中包含了另外q种产品。
平均链接法:
利用距离和关联度两个指标,建立模型得出数据,即可定量表达网站中多种商品间的关联关系的密切程度。
第二问:
利用matlab编程(程序见附录)对优化后的购买数据进行聚类分析,结果如下:
1、两种商品组合购买分析
编号1
编号2
人数
120
368
329
145
217
329
205
368
307
217
419
289
217
368
289
217
529
286
217
829
286
362
368
280
368
413
258
368
419
256
表一两种商品组合购买记录
表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中120与368商品的购买组合为最频繁购买组合,商品数2,频繁出现329次。
2、三种商品组合购买分析
商品1
商品2
商品3
人数
217
368
529
101
217
368
541
79
217
368
489
77
217
266
368
70
217
368
692
69
217
682
914
69
217
489
529
68
217
890
914
68
217
368
690
66
217
657
956
66
表二两种商品组合购买记录
表二截取了三种商品购买记录前10位的商品,有表二可以看出,三种商品的购买组合中商品217、商品368与商品529的购买组合为最频繁购买组合,商品数3,频繁出现101次。
同时有表二,还可以发现,出现最频繁的商品组合均含217号商品,证明217号商品在所有商品中购买量较大。
3、四种商品组合购买记录
商品编号1
商品编号2
商品编号3
商品编号4
购买人数
217
368
529
690
55
217
368
176
690
54
217
368
266
529
53
217
368
176
529
51
217
368
266
690
51
217
368
529
571
51
217
368
690
266
51
217
368
571
690
50
217
368
176
266
49
217
368
176
571
49
表三四种商品组合购买记录
表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中商品217、商品368、商品529、商品690的购买组合为最频繁购买组合,商品数4,频繁出现55次。
问题三:
编号1
编号2
人数
利润
总利润
120
368
329
502.02
165164.58
368
419
256
587.93
150510.08
205
368
307
479.64
147249.48
368
529
255
575.95
146867.25
368
692
247
587.93
145218.71
368
438
256
565.29
144714.24
368
720
247
581.82
143709.54
368
752
246
581.82
143127.72
419
720
227
587.93
133460.11
368
956
236
555.12
131008.32
表4两种商品购买组合利润
表4截取了两种商品购买记录利润前10位的商品,由表4可以看出,两种商品的购买组合中商品120、商品368的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.
商品1
商品2
商品3
人数
组合利润
总利润
217
368
529
101
581.1588
58697.0388
217
368
692
69
568.6388
39236.0772
217
368
541
79
484.8488
38303.0552
217
368
401
63
581.1588
36613.0044
217
657
956
66
554.4588
36594.2808
217
145
529
61
575.2888
35092.6168
217
529
692
61
562.7688
34328.8968
217
368
690
66
489.5888
32312.8608
217
914
368
61
489.5888
29864.9168
217
368
489
77
301.3276
23202.2252
表5三种商品购买组合利润
表5截取了三种商品购买记录利润前10位的商品,由表5可以看出,三种商品的购买组合中商品217、商品368、商品529的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.
商品编号1
商品编号2
商品编号3
商品编号4
人数
组合利润
总利润
217
368
176
529
51
872.0688
44475.5088
217
368
529
690
55
681.1528