国赛建模b题.docx
《国赛建模b题.docx》由会员分享,可在线阅读,更多相关《国赛建模b题.docx(14页珍藏版)》请在冰豆网上搜索。
国赛建模b题
“拍照赚钱”类软件任务定价规律的探讨与改良方案分析
摘要
随着互联网技术的发展,人们在经济水平飞速发展的同时,各种观念也在不断变化;例如互联网技术已通过其庞大的用户量及强大的执行效率使得许多曾需要专人投入大量成本的传统行业趋于大众化、分散化。
例如最近市场上新兴的“拍照赚钱”软件,它利用人们的零散时间随时随地拍照赚钱,备受大众青睐。
然而该类软件仍然存在定价不合理、任务完成度不高等阻碍该类软件发展的瓶颈。
本文通过对客户与任务位置、完成任务收益等变量进行数学模型分析,提出了一些比该类软件现行运作模式更科学、更高效的方案。
第一问中,为确定现有定价方案的问题,我们以任务分配范围内不同的城区作为基本单位,将任务根据定价分为三份,并通过建立线性回归方程了解了各客观变量对定价产生的影响,再通过对失败案例的因子分析找到了导致失败的变量及它们对失败变量的影响程度。
第二问设计新方案时,以为拍照赚钱平台带来最大利润为根本目的,将现有方案与变量间相互作用情况相似的垄断性市场中打车平台收费方案进行类比,分析并一一对应相应的变量关系,再通过现有的对打车平台获利最大值计算的模型变量的类比得出新方案。
第三问中,通过聚类分析可以将5个相聚较近的变量进行“打包”。
“打包”的点即为包点,将其代入第一问中地址相关信息,可求出打包后每个地区所具有的“包点”的个数,再由第二问公式问求出定价,并与原始结果进行对照。
第四问中,将所给密集数据视为在同一点进行“打包”,求出打包结果所在点的GPS并代入第一问中的值
关键词:
自然区域分区、多项线形回归预测、因子分析、类比、CurveFittingTool、聚类分析、
一、问题重述
随着科技日新月异的发展,人们获取钱财的方法越来越多,“众包”一词也出现在大众视野。
众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定(而且通常是大型的)大众网络的做法。
众包的任务通常是由个人来承担,但如果涉及到需要多人协作完成的任务,也有可能依靠开源的个体生产的形式出现。
其中,“拍照赚钱”是一股热流,它能及时反映商家想要了解的问题以及随时发布或更新任务,用户只需登录手机客户端,找到适合自己的差事,按要求按时完成,就能获得相应的酬金。
但是,“拍照赚钱”也存在着许多问题,例如有些任务的位置与任务完成难度直接相关,部分易于完成的任务会被“争抢”,而另一些任务就因位置不太合适或时间点比较不妥就导致接单比较少。
而且,任务的定价也和位置,时间等因素有关,然后这也影响到了接单率。
分析任务定价规律,如何设置合适的任务定价方案来提高任务的完成率;在实际中,因为用户分布比较密集导致的任务被争抢而实行将一些任务联合在一起打包发布时,如何修改定价模型以及修改后会对任务完成情况造成什么后果,这些问题都是我们要思考并解决的。
这些问题一旦被解决之后,对商家,平台以及用户,都是一种更好的体验感受,也能更大限度的发挥出该软件的作用。
二、问题分析
第一问中,由题意可知,所给条件内可能与价格分布有关的仅有由经纬度确定的地理位置情况与会员的密度等相关变量。
此时可假设其中一个变量为影响价格的唯一因素,并进行拟合运算。
若成功,则以该方案进行运算;若失败,即将所有变量作为拟合元素进行计算,求出影响定价因素,并用因子分析求出失败率。
第二问中,重新分配定价的根本目的是给予平台方更大的利益。
这里可以采用类比的方法,将拍照赚钱平台的各个变量与市场上已广泛使用的出租车打车软件的各项变量进行类比,并得出适用于现有模型的求定价方案。
第三问中,通过分析的5个点的相关位置信息求均值,并将5个点的对应属性(经纬度、价格分配等)的总和视为一个“较大”的点,可求出多个点共同作用在区域中分布情况。
第四问将所给点数代入前问所求出的多种解析方法,寻找最优解并根据数据分布特色做出最合适的解析方案。
三、模型假设
1.假设同一之间题中会员所在地域(、、、XX等地)的气候条件基本相同,气候差异不会对会员的任务完成情况产生实质性影响。
2.假设会员会以效率优先的原则选择最近的拍照地点,不倾向于在任务充足时刻意绕远路或进入其他城区进行拍摄。
3.假设会员完成任务能力彼此间差异较小可忽略
4.假设同一城市不同区之间的发展状况差异小于不同城市间发展状况差异
5.假设会员对完成任务的积极性相对稳定,一片区域内题中所给任务的完成与否可以体现出该区域会员的积极程度
四、符号说明
Ppt:
平台获得最大利润的定价
fd:
单位地区内平均价格
O:
聚类分析后单位地区定价
d:
会员接取可做任务的概率
td:
接取任务时间范围
np:
任务数量
五、模型的建立与求解
5.1.1影响任务标价主要因素的确认
在附件1中,我们可知835个位置不同的任务的标价与其完成情况。
对题干进行分析可知,所给条件下能够影响任务定价规律的客观因素仅有任务所在的位置以及与可完成其的会员相关情况。
假设任务标价仅与其所在位置(即经纬度)存在联系。
以表1中数据经度与纬度作为因变量,可得仅经纬度一项因素与任务价格分布相关关系:
VariablesEntered/Removeda
Model
VariablesEntered
VariablesRemoved
Method
1
任务gps纬度,任务gps经度b
.
Enter
a.DependentVariable:
任务标价
b.Allrequestedvariablesentered.
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.167a
.028
.025
3.331
a.Predictors:
(Constant),任务gps纬度,任务gps经度
b.DependentVariable:
任务标价
分析结果显示,该模型在分析价格变化时可用的情况仅占16.7%,不足以证明单纯的经纬度差异与价格变化存在直接相关。
由此可见,任务的定价规律与会员的分布、当地会员对任务总体完成情况以及会员信誉度等因素存在相关关系。
任务的定价规律能直接影响任务的完成状况。
为确认会员总体任务完成情况与任务定价范围差异之间的关系,我们根据人数的差异及奖励金变化的趋势将任务奖励金额分为了三个区间:
[65,69.5],[70,75],[80,+∞],并使用XGeocoding软件求出了题中所给坐标范围内所包含的不同城区内每一个城区分布的会员人数、高信誉度会员人数相应的任务完成状况。
实际情况如附件1所示:
以每个区域内酬金为65至69.5元内成功完成的任务数量为因变量;该区域任务完成率、分配任务数、会员数及会员完成任务数比例为自变量,通过spss的线性回归方程功能,可建立任务量与各自变量的关系模型。
结果为:
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.923a
.852
.831
8.007
a.預測值:
(常數),高信誉会员分布,分配任务数,会员数
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
7756.602
3
2585.534
40.328
.000b
殘差
1346.358
21
64.112
總計
9102.960
24
a.應變數:
65-69.5
b.預測值:
(常數),高信誉会员分布,分配任务数,会员数
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
-4.074
2.304
-1.768
.092
会员数
-.044
.066
-.198
-.678
.505
分配任务数
.574
.087
1.114
6.631
.000
高信誉会员分布
-.076
.423
-.040
-.180
.859
a.應變數\:
65-69.5
表中数据显示,数据变异数显著性为0.00,适用于线性回归分析情况;且在任务酬金为65至69.5间时且在其对应区域时,模型对其分析的准确率达到92.4%。
在模型范围内以各变量非标准化系数做出变量拟合方程为:
同理,酬金为70至75元任务与其相应因变量关系为:
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.890a
.792
.763
8.119
a.預測值:
(常數),高信誉会员分布,分配任务数,会员数
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
5279.789
3
1759.930
26.697
.000b
殘差
1384.371
21
65.922
總計
6664.160
24
a.應變數:
70-75
b.預測值:
(常數),高信誉会员分布,分配任务数,会员数
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
-.741
2.337
-.317
.754
会员数
.004
.066
.022
.065
.949
分配任务数
.537
.088
1.218
6.117
.000
高信誉会员分布
-.938
.429
-.581
-2.185
.040
a.應變數\:
70-75
表中数据变异数显著性为0.00,适用于线性回归分析情况;在对应区域内任务酬金为70至75之间时,模型对其分析的准确率达到89%。
其拟合方程为:
酬金为80元及以上的任务与其相应因变量关系为:
模型摘要
模型
R
R平方
調整後R平方
標準偏斜度錯誤
1
.628a
.394
.308
3.341
a.預測值:
(常數),高信誉会员分布,分配任务数,会员数
變異數分析a
模型
平方和
df
平均值平方
F
顯著性
1
迴歸
152.662
3
50.887
4.559
.013b
殘差
234.378
21
11.161
總計
387.040
24
a.應變數:
80以上
b.預測值:
(常數),高信誉会员分布,分配任务数,会员数
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
-.475
.961
-.494
.627
会员数
-.021
.027
-.447
-.758
.457
分配任务数
.107
.036
1.002
2.948
.008
高信誉会员分布
-.027
.177
-.070
-.155
.878
a.應變數\:
80以上
上表中数据变异数显著性为0.13,可用于线性回归分析情况;且在任务酬金为80以上且在其对应区域时,模型对其分析的准确率为62.8%。
对其中数据建立拟合方程为:
综合上表中数据所述,可知影响定价的主要因素分别为。
5.1.2任务未完成的原因分析
因子分析的功能是在多个变量中找出隐藏的具有代表性的因子并将相同本质的变量归入一个因子,有检验变量间关系的功能。
1.1.1中结论显示,影响任务完成情况的因素包括位置因素、价格因素与所在地会员相关因素。
对每个区域的失败任务进行分析时,可用SPSS的因子分析功能分析出价格因素与会员数、高信誉会员分布情况和区域内任务完成率等变量中的每一项对确立失败结果所占影响的比重。
结果如下:
相關性矩陣
失败率
失败量
会员数
分配任务数
平均收益
高信誉会员分布
相關
失败率
1.000
.452
.026
-.250
-.459
.140
失败量
.452
1.000
.560
.294
-.462
.653
会员数
.026
.560
1.000
.857
-.318
.923
分配任务数
-.250
.294
.857
1.000
-.193
.744
平均收益
-.459
-.462
-.318
-.193
1.000
-.386
高信誉会员分布
.140
.653
.923
.744
-.386
1.000
表中数据显示,会影响失败率的变量中对失败率影响最大的是平均收益,其次是失败量,接下来是分配任务数、高信誉会员分布,最后是会员数。
其中失败量是无法控制的变量,而其余变量除分配任务数与平均收益对失败率呈负相关以外,其余变量与失败率均呈正相关。
由此可知,导致任务未完成的原因可能性由大到小分别为完成任务平均收益低、区域分配任务数过少、区域内会员信誉度高于己方,以及区域内存在过多会员与己方竞争。
5.2附件一项目的新定价方案
以“拍照赚钱”软件的角度考虑,最佳的定价方案无疑是该平台获得最大利润的情况。
目前,“拍照赚钱”类为一名客户提供一对一服务机会的平台有很多,其中各变量要素与拍照赚钱软件平台相似度最高的是出租车APP平台;在垄断性市场中,相对静止的客户用户通过金钱
根据题意,可将拍照赚钱系统类比为垄断型市场。
其他公司以一定资金向拍照赚钱平台投送任务可类比为行人向平台缴纳注册费;用户以个数为单位完成平台分配的任务可以类比为垄断型市场中司机单次接触乘客与平台发生的交易费。
因此用户与平台的合理定价关系可类比为司机以交易费形式从打车软件平台搭载注册费形式乘客的定价关系。
为[1]:
式中Ppt为所求的,能使平台获得最大利润的新定价;fd为单位成本,在本题中即为单位地区内平均价格;
d为司机接触偏好乘客(本题中即为会员接取可做任务)的概率;0至td为单位司机接触乘客时间范围(接取任务时间范围);np为乘客(任务)数量;ap为增加一单位司机(会员)导致乘客(任务)增加的效用,为司机对乘客的交叉网络外部性系数;θ(ud)的值为驾驶员(θ(ud)=nd,本题中为会员数)数量的效应函数[2]。
由附录1中表格可分别知或求出任务所给范围内各个区域的上述变量,进而求出每一区域Ppt的值(见附录1“O”列);根据1-1-1分析的数据,可用Matlab的curvefittingtool工具求出价格与完成率曲线及其相关变量。
曲线如下:
其中a0=69.67(66.68,72.66)
a1=0.6826(-4.241,5.606)
b1=-3.552(-5.998,-1.106)
w=4.806(1.194,8.417)
再将新的Ppt值代入曲线,则可求出本方法在每个地区的完成率(见附录1“p”列)。
在此方程中,将本应为因变量的完成率视为了自变量,本应为自变量的定价视为了因变量。
因此以定价为自变量的方程为上述方程的反函数。
为:
将新方案完成率与旧方案完成率进行平均数比较,发现新方案中任务完成率达到0.644,而旧任务的完成率为0.560,证明新模型在增加平台获利的同时可以增加任务完成率。
5.3任务打包发布情况下的定价模型与对结果的影响
5.3.1对任务打包的方案
附录1中数据显示,任务完成情况与任务的相关地理位置有关。
为排除会员在选择任务时发生冲突的情况,我们以5个任务为一组,用spss对所有任务进行k-均值聚类分析。
得出结果见附录2;将进行过聚类分析的5个点的相关属性范围求和,并将5个点的对应属性(经纬度、价格分配等)的总和视为一个“较大”的点(称为包点)。
图3-1:
附录1中已完成任务确立出的包点数量及分布
5.3.2打包过的任务在原任务相应城区位置的分布与计算
包点的信息代表点内元素的综合信息。
在5.3.1中,我们可以求出各个包点的经纬度,并将经纬度信息与所在城区一一对应(见附1中)。
每一区中包点的数量*5既是影响该区域点总数的数量。
直接将相关数据代入5-2中公式,可求得包点情况下在不同区域范围内每一点的定价和完成率,最后求得的总体平均的完成率为64.5%。
比之前第二问的结果64.4%略有增长。
由此可见将数据打包对提高精确度有一定积极影响。
5.4附件三的任务定价方案与实施效果预估
5.4.1附件三任务的地址分布
通过Matlab的CurveFittingTool工具分析附件3中,可将新旧任务点在地理上的分布较为清楚直观地展现。
图4-1:
已完成任务的地理分布情况。
图:
4-2:
新任务的地理分布情况。
如上图所示,附件三所给任务的经纬度上下限分布与已完成数据基本相同,但附件三中数据密集程度远远大于已完成数据的密集程度。
5.4.2新数据的任务定价方案
由于附件3中任务总数大,分布范围极小且散点较少,可忽略分散分布的点,并将中心周围密集分布的点集中至中心点进行“打包”。
其中由于最下方区域面积较大,根据变量数量与前一问比例将其分层六份。
结果如下:
任务数
打包变量数
平均价格
打包后定价
打包后完成率
上
258
51
66.625
49.625
0.488974
中
249
49
66.192
49.85897
0.528252
下(代表性)240
240
48
66.076
50.07609
0.566258
六、模型评价
模型优点:
1.第一问的模型将任务所在城区作为变量之一,将会员条件、等信息按地区排布并将价格分段进行分析,得出的分析结果在数据密集区域与原变量拟合度较高且可以针对定价的不同进行分区处理。
2.第二问中拟定的模型在提升任务完成率和增加平台收入两方面都较原方案有一定提升。
3.第三问对积极会员实现了较为充分的利用,增加任务完成效率的同时可以充分调动会员积极性
模型不足:
1.第一问及第二问所建立的模型都是按城区的自然分布排布的,没有考虑到城区内部的变量分布状况差异,不适合用于较小区域分析
2.第一问在任务定价较高时拟合度会下降,造成结果不精确。
3.第三问中不同聚类分析点周围任务的分布状况可能不同,导致不同的“任务包”完成难度存在差异,仍然无法完全避免争抢现象。
4.第四问中以任务密集分布点中心为准进行数据的“打包”计算距离不能完全反应会员与任务间距离,可能出现误差。
建议:
1.在分析过程中,我们发现软件用户中的活跃用户数量不多、分布过于密集且与总用户数相比只占很小一部分。
建议通过定期举办活动、在软件内内嵌AR游戏等方案提升用户活跃度,并在任务难以完成区域通过举办活动等方式保障任务的顺利完成。
2.运营方可以根据客户信誉度、完成任务量等变量对用户进行区分并将信誉度高、完成任务量大的的用户设为vip并提供额外任务分配,将会员资源利用率提升。
七、参考文献
[1]:
《打车app平台定价策略分析——基于双边与多边视角》——耿磊
[2]:
《效用函数值的计算方法》——姜青舫
八、附录
[1]:
数据在各相应城区的分布
[2]:
聚类分析结果