网购问题中的购买频数和产品关联度以及促销方案分析数学建模.docx
《网购问题中的购买频数和产品关联度以及促销方案分析数学建模.docx》由会员分享,可在线阅读,更多相关《网购问题中的购买频数和产品关联度以及促销方案分析数学建模.docx(21页珍藏版)》请在冰豆网上搜索。
网购问题中的购买频数和产品关联度以及促销方案分析数学建模
网购问题中的购买频数和产品关联度以及促销方案分析数学建模
网络购物分析
【摘要】
本题是对网购问题的分析,由于商场旨在追求利益的最大化,因此对商品聚类分析、找出利益最高的组合,为商家呈现出最好的营销方式,是本题主旨。
同时由于本题数据繁杂庞多,其结果也与数据有着直观和密切的联系,所以对于数据的处理极其准确程度也显得尤为重要。
(本题所给数据皆真实有效)。
对于问题一,求其商品之间的关联程度,即指如果买一副镜框,一般情况下也要买一副镜片,此时可认为镜片和镜框的关联度很高。
故解决此问题可以运用聚类的方法和概率论知识相结合的办法,建立相应的模型,找出关联度很高的组合,即为所求的的结果。
对于问题二,利用穷举法以及第一问的模型,便可以找出同时被频繁购买的商品的组合,便可以据此进行第三问的求解,所以第二问是一个承接的作用。
对于问题三,在问题二的基础上得出促销方案。
故需知道各种组合的利益,运用最优解法,结合购买的次数最多以及商品的价格较高两个因素,找出各种组合中的利益最大的组合,促销在此基础上进行。
例如:
在最大利益的组合中,有一利益最小的商品,则可以对此商品进行打折,以此达到薄利多销的营销策略。
经过市场调查,可以得到使其利润最大的打折率f(i),,那么f(i)便是我们的促销打折率,以此便可制定促销方案。
与此,也可运用其他的策略。
问题一,问题二结果如下表所示:
问题一结果:
组合商品编号
数目
关联度
V368682
286
0.07732872
V368529
329
0.076986159
V956538413
120
0.005608505
V368937829413
72
0.00003998
问题二结果:
组合商品编号
数目
V368529
329
V368829
307
V368489682
122
V368937829413
72
问题三结果:
一种商品:
最高获利382255.74元,商品编号为368。
二种商品组合:
最高获利189487.55元,商品编号为(368529)。
三种商品组合:
最高获利76468元,商品编号为(V368829529)。
四种商品组合:
最高获利737.6688元,商品编号为(V489438956722)。
【关键词】0,1变量,关联度,聚类分析,穷举法,最优解法,促销,spss软件,matlab软件。
一、问题重述
网店老板经常关心的问题是顾客的购物习惯,即什么商品组或集合顾客会在一次购物时同时购买。
他们可以把这些“同类商品”相互关联在网页内,以便于顾客浏览商品,引导顾客消费,进而增加销量。
已知某购物网站一段时期所有顾客购买物品的清单和相应商品的利润,需要我们给网店老板一个合理的顾客购物习惯分析报告,并提供一个促销计划的初步方案。
问题1试建立一种数学模型,该模型能定量表达网站中多种商品间的关联关系的密切程度。
数据见附件1.
问题2根据在问题1中建立的模型,分析出哪些商品是最频繁被同时购买的,并且找到的最频繁被同时购买的商品数量越多越好。
例如:
如果商品1、商品2、商品3,商品4在4625个购物记录中同时出现了200次,则可以认为这三个商品同时频繁出现了200次,商品数量是4。
问题3附件2给出了这999中商品的对应的利润,根据在问题1、问题2中建立的模型,给出一种初步的促销方案,使购物网站的效益进一步增大。
二、问题分析
本题旨在为商家做出商品分析报告,提出合理的建议,达到利益最大化的目标。
由于本题问题层层递进,而且数据量庞大,问题所问与初始数据密切相关,故数据的处理显得至关重要。
对此,将matlab与spss,excel等软件相结合,便可对原始数据进行处理以得到更为直观的数据。
问题一运用聚类分析和概率相结合的办法。
现将原始数据转换为0,1变量,所谓0,1变量,即指把商品编号和人数组成二维表,若某人买了某编号的商品,则在此对应的位置标1,反之为0。
这样便得到利于计算和直观反映的数据。
此过程由spss和matlab进行,具体详见模型解答过程。
在0,1变量的基础上,对商品进行各种组合,若某人买了一种组合中的全部商品,即对应的0,1变量皆为1,则重新标记为1,反之则为0。
以之求和,便可得到购买数量最多的组合,再用其模型求得其关联度。
问题二在问题一的基础上求解,利用穷举法和问题一中的结果,可将频繁购买的组合求出来。
问题三利用最优解法,把各种组合中的最大利益求出来,在其组合中找出利益最小的商品,则此种商品为需要打折促销的商品,再根据f(i)决定促销策略。
同时也根据问题二的结果,列出需要放在一起进行广告的商品组合数,至此则此题已完全解决。
三、模型假设
1.对于问题三中,各个商品利润保持不变。
2.表格中的数据能真实反映当地消费者购物情况。
3.短时期内商品销售不会变化,即种类数目不会有太大的变化。
4.关于商品的关联度,如果买一种商品的同时买另一种商品,则就说明它们有关联度,如眼镜框和镜片,排除无意间同时购买的因素,如面包和衣服等,故此题中的同时购买即认为全为有关系的,即是有关联度的。
5.题中的打折率f(i)可以从现实中得到,以至于促销策略可以实行。
6.不存在打破这种商品购买格局的因素。
7.商场是追求利润的最大化,由于数据众多,故提取单笔购买数量从大到小排列的5%作为数据样本。
对实际结果分析没多大的影响。
四、符号说明
Ni表示i商品购买的频率;
Nj表示j商品购买的频率;
表示k商品购买的频率;
表示l商品购买的频率;
表示i和j商品同时购买的频率;
表示打折后i和j商品同时购买的频率;
表示i,j,k商品同时购买的频率;
表示i,j,k,l商品同时购买的频率;
表示i,j商品的关联度;
表示i,j,k商品的关联度;
表示i,j,k,l商品的关联度;
T表示商品的总利润;
m表示购买的人数;
n表示商品的数目;
表示购买商品i的利润;
d(i,j)表示第i人是否购买了第j种商品,用0,1表示买与不买,d为0,1的矩阵;
f(i)表示打折率;
Z表示促销前销售量;
Z’表示促销后的销售量。
五、模型的建立
对于此题的模型,为求其关联度,我们运用概率方面的知识:
P(A/B)=P(AB)/P(B)
P(B/A)=P(AB)/P(A)
则有:
P(A/B)*P(B/A)=P(AB)/P(B)*P(AB)/P(A);
故此联系上面的公式,我们可以得到以下模型:
其中:
Ni表示i商品购买的频率;Nj表示j商品购买的频率;
表示i和j商品同时购买的频率;
表示i,j商品的关联度。
这样便是两个商品的模型。
三个商品和四个商品等的以此类推:
……
对于第二题的模型,则在第一题基础上,求出
,
,
中最大的几组,便是可以得到结果。
第三题模型:
在第二组求出的最大的
,
,
中,求其组合中的最大利益:
T1=Ni*
;
T2=
*(
+
);
T3=
*(
+
+
);
T4=
*(
+
+
+
);
其中T1,T2,T3,T4分别为一个商品,两个商品组合,三个商品组合,四个商品组合的最大利润。
在促销过程中,设商品i在组合
中利润最小,则对其打折,打折率为f(i),打折前销售量为Z,打折后销售量为Z’,购买i,j的人数为
,则其利润为:
T=
*(
+
*f(i))
则多获益:
t=
*(
+
*f(i))-
*(
+
)
这样以此类推,三种组合,四种组合皆为如此。
六、模型求解
问题一:
首先将消费记录数据用spss进行整理,然后用matlab求其0,1矩阵,其程序如附录中程序一。
d(i,j)=1第i人买了第j种商品
1第i人没买第j种商品
然后求和
,求得各种商品的购买量,根据假设取其前50种,
结果如下:
(V368表示商品编号,第二列数字为购买量)
V368
1314
V829
1079
V529
1070
V510
944
V419
927
V217
909
V489
868
V438
833
V956
824
V914
809
V766
807
V682
805
V692
802
V937
781
V205
768
V722
744
V720
741
V883
730
V145
676
V362
676
V895
669
V897
667
V283
660
V8
658
V177
647
V480
641
V752
636
V966
635
V470
633
V71
632
V541
622
V204
621
V140
620
V12
616
V538
616
V775
614
V890
611
V120
609
V413
607
V450
607
V354
606
V676
595
V55
592
V694
586
V401
581
V597
568
V72
553
V236
552
V110
549
V161
548
然后对这五十种商品进行处理,任意进行组合,例如,对于i和j号商品,若某人同时买了,则记为1,反之为0。
然后对4625名顾客求和,得到i和j商品共同购买的数目
,再用公式
,此过程用matlab做,其程序如附件中的程序2,取其前最高关联度的十组,得到结果如下:
组合商品编号
数目
关联度
V368682
286
0.07732872
V368529
329
0.076986159
V529692
251
0.07341576
V368489
289
0.073228577
V368829
307
0.066475244
V368217
280
0.065638223
V368937
258
0.0648624
V829692
236
0.064361802
V529438
237
0.063018478
V368720
246
0.062152219
对于三种商品的组合,类似两种组合的处理办法,使用公式
,利用matlab,其程序见附件程序3。
取其前最高关联度的四组,得到如下结果:
组合商品编号
数目
关联度
V956538413
120
0.005608505
V368489682
122
0.001977737
V368529217
101
0.00080616
V368829529
100
0.000659173
对于四种商品的组合,类似三种组合的处理办法,使用公式
,利用matlab,其程序见附件程序4。
取其前最高关联度的二组,得到如下结果:
组合商品编号
数目
关联度
V368937829413
72
0.00003998
V489438956722
47
0.00001101
问题二:
根据问题一得到的中间结果,得到组合为两种,三种,四种的最高销售量的组合,其销售量和商品编号如下:
1.两种组合:
组合商品编号
数目
利润
V368529
329
189487.55
V368829
307
147249.48
V368489
289
85578.3332
V368682
286
90164.074
V368217
280
82913.264
V368419
266
83858.894
V368937
258
76398.6504
V368510
256
100071.424
2.三种组合:
组合商品编号
数目
利润
V368489682
122
39097.0716
V956538413
120
57274.68
V368529217
101
58697.0388
V368829529
100
76468
3.四种组合:
组合商品编号
数目
利润
V368937829413
72
673.5788
V489438956722
47
737.6688
问题三:
在第二组求出的较大的
,
,
中,求其组合中的最大利益:
T1=Ni*
;
T2=
*(
+
);
T3=
*(
+
+
);
T4=
*(
+
+
+
);
得到结果如下:
MaxT1=382255.74,说明368号商品获利最高。
MaxT2=189487.55,说明其组合为368号商品和529号商品在两种商品的组合中获利最高;
MaxT3=76468,说明其组合为368号商品和829号商品以及529号商品在三种商品的组合中获利最高;
MaxT4=737.6688,说明其组合为489号商品和438商品和956号商品以及722号商品在四种商品的组合中获利最高。
在促销中盈利如下:
两种组合:
其中529号商品盈利少,对其打折,设打折率为f(529),打折后同时购买此两种商品的数量增加u1,则获利
T=(368+u1)*(290.91+285.04*f(529))
较促销之前多获利:
t=(368+u1)*(290.91+285.04*f(529))-189487.55
三种组合:
其中829号商品盈利少,对其打折,设打折率为f(829),打折后同时购买此三种商品的数量增加u2,则获利
T=(100+u2)*[290.91+188.73*f(829)+285.04]
较促销之前多获利:
t=(100+u2)*[290.91+188.73*f(829)+285.04]-76468
四种组合:
其中489号商品盈利少,对其打折,设打折率为f(489),打折后同时购买此四种商品的数量增加u3,则获利
T=(47+u3)*(5.2088*f(489)+274.78+264.21+193.47)
较促销之前多获利:
t=(47+u3)*(5.2088*f(489)+274.78+264.21+193.47)-737.6688
同时还有其他如下的促销策略:
把组合(368529),(368829),(368489),(368682),(368217),(368419),(368937),(368510),(368489682),(956538413),(368529217),(368829529),(368937829413),(489438956722)等组合中的商品在网站上置于同一板块,便于吸引消费者的眼球,出于消费者省钱以及图方便的心理,便可以增加商品的出售额,获取更多的利益。
七.模型评价
(一).优点:
1、本题研究了网购情况,首先对于问题的较为庞杂的数据用matlab和spss等程序做了处理,使数据更为直观明了,同时有利于计算。
2、在具体题目中运用了聚类分析的方法,使结果更为直观,形式更为简明,由于本题讨论市场商业问题,故此与商业方面报告的结论易读化相吻合。
3、本题还运用了最优解法,使结论更具说服力,模型更加详细。
(二).缺点:
1、由于数据量的庞大,本题取其前五十种商品,对结论有一定的影响,但是影响不大,一般情况下可以忽略不计。
2、本题也采用了穷举法,由于穷举法的局限性,不能得到最好的效果,但由于此题数据的特殊性,对结果影响不大,也可以忽略不计。
3、采用聚类分析时,在样本量较大时,要获得聚类结论有一定的困难在样本量较大时。
八、模型的推广
本题是关于网购问题的分析,现代社会,经济日益发展,商品经济逐渐成为主流,电子商务更是重中之重,同时大型超市也将逐步替代小型商店,本题中的模型,既适用于电子商务方面,也适用与大型超市,也即“购物篮”问题。
故此只要有商品经济存在的地方,本模型就会使用,并且有一定的效益。
所以本模型的使用范围也会越来越广。
当然,也不局限于商品经济中,但凡用到聚类的地方,就有本模型存在的价值。
参考文献
[1]姜启源谢金星叶俊,《数学模型》(第四版),北京:
高等教育出版社,2011年;
[2]韩中庚,《数学建模方法及其应用》,北京市:
高等教育出版社,2009年;
[3]卓金武,《MATLAB在数学建模中的应用》,北京市:
北京航空航天大学出版社,2011年;
[4]赫孝良,《数学建模实验》,西南交通大学出版社,1999.10;
[5]雷功炎,《中国大学生数学建模竞赛》,高等教育出版社,2001.12.
附录:
程序一:
b=zeros(4625,999);
c=zeros(1,999);
fori=1:
4625
forj=1:
72
l=a(i,j);
ifl>0
ifl<1000
b(i,l)=1;
c(1,l)=c(1,l)+b(i,l);
end
end
end
end
程序二:
u=zeros(50,50);
forj=1:
50
fori=1:
4625
ifd(i,j)>0
u(j,j)=u(j,j)+1;
end
end
disp(u)
end
forj=1:
49
fork=(j+1):
50
forh=1:
4625
ifd(h,j)>0
ifd(h,k)>0
u(j,k)=u(j,k)+1;
u(k,j)=u(j,k);
end
end
end
end
disp(u);
end
程序三:
e=zeros(20,4);
h=1;
forj=1:
48
fork=j+1:
49
form=k+1:
50
t=0;
fori=1:
4625
ifd(i,j)==1&&d(i,k)==1&&d(i,m)==1
t=t+1;
end
end
ift>94
e(h,1)=j;
e(h,2)=k;
e(h,3)=m;
e(h,4)=t;
h=h+1;
end
end
end
disp(e)
end
程序四:
e=zeros(50,5);end
h=1;end
forj=1:
47end
fork=j+1:
48end
form=k+1:
49disp(e);
forl=m+1:
50end
t=0;
fori=1:
4625
ifd(i,j)==1&&d(i,k)==1&&d(i,m)==1&&d(i,l)==1
t=t+1;
end
end
ift>40
e(h,1)=j;
e(h,2)=k;
e(h,3)=m;
e(h,4)=l;
e(h,5)=t;
h=h+1;