关于拍照赚钱任务定价的分析与研究.docx
《关于拍照赚钱任务定价的分析与研究.docx》由会员分享,可在线阅读,更多相关《关于拍照赚钱任务定价的分析与研究.docx(19页珍藏版)》请在冰豆网上搜索。
关于拍照赚钱任务定价的分析与研究
Revisedasof23November2020
关于拍照赚钱任务定价的分析与研究
关于“拍照赚钱”任务定价的分析与研究
摘要
“拍照赚钱”是移动互联网下的一种自助式服务模式,而app成为基于移动互联网的自助式劳务众包平台运行的核心,通过对任务定价规律的分析、理解、整合。
从而得出位置、会员信息如何影响任务定价以及未完成任务的原因及规律。
进而减少控制未完成任务量,优化任务定价方案。
针对问题一,将附件一数据进行可视化,通过bubbleplot画图,了解数据的信息,紧接着将任务的定价与任务周围的区域单位面积内任务完成能力进行分析,然后以可使用人力的密度、任务的价格为自变量,对任务完成情况做logistic回归分析,最后得到两个结论:
一个可能的解释为对这些任务定价定的过低,对会员没有吸引力;另一个可能的解释为在该区域定价策略失效,无法对该区域的会员产生足够的吸引力。
针对问题二,通过spss算法中导入数据输出的几个表中,模型系数总和检验表,要看他模型的P值是不是小于,判断我们这个logistic回归方程有没有意义。
通过数据预处理单位面积下的会员信誉值、任务额度以及道路交通通行量数据整合,将上述处理过的数据归纳后代入附件一中,再将合并后的数据代入spss中进行logistic回归处理得到新的定价方案,经过对比完成任务前后方案改变后发现新方案较原方案更有优势。
针对问题三,运用聚类分析,建立针对问题二的优化模型分析,通过会员的坐标经纬度位置分析,确立打包模型,考虑到打包后会员位置以及任务密度下降,因此将利用规划后的最优的打包模型将之与第二问模型加以比较分析,最后得出结论:
优化的模型降低%~%的任务总金额,而且能减少%~%的任务未完成率。
针对问题四,将附件三的数据运用到问题三构建的任务定价模型当中,通过分析不同完成度的定价式方案,之后在此基础上添加定价金额和完成度双重指标加以分析。
设计出两张图像,最后通过综合评价对结果进行排列,得出最优任务定价方案的综合评价值为,最差方案的综合评价值为,得到在任务完成度为60%~70%时的新定价方案最优。
最后根据以上四问建立的任务定价模型,通过进一步分析,对任务定价规律有了更深层认识,对促进app自助式劳务众包平台运行具有一定的参考价值。
关键词:
logistic回归模型多目标规划聚类分析综合分析评价模型
一、问题重述
问题的背景
近年来,众包商业模式符合市场激烈竞争节约运作成本的需要,同时也能满足网络时代客户参与产品设计和服务规划的需求,把设计、生产和销售等环节联系起来,最大程度上避免了产品设计生产和客户需求的脱节。
本文借用研究“拍照赚钱”app任务定价规律借此来突出众包商业模式,相较于传统的市场调查方法大大节省成本,有效保证程序运行的效益化。
问题的相关信息
附件一是一个已结束项目的任务数据,其中有任务的位置、定价和完成情况(“1”和“0”分别代表完成及未完成);附件二是会员信息数据,其中有会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉度越高,越优先开始选择任务,其配额也就越大(根据预订限额所占比例配发任务);附件三是一个新的项目任务数据,只有任务的位置信息。
需解决的问题
问题一:
通过研究附件一中的任务定价规律,研究并分析任务未完成的原因。
问题二:
为附件一中的项目设计新的任务定价方案,同原方案进行比较。
问题三:
在实际生活中很多任务相对集中,导致客户相互争抢,其中考虑是
将这些任务联合在一起打包发布。
在这种考虑下,怎样修改前面的定价模型,又
会对最终的任务完成情况产生什么影响
问题四:
针对附件三中的新项目给出新的任务定价方案,并评价该方案的可
行性。
二、模型假设
1.假设任务接收、操作、完成困难程度一致,即不考虑不同任务方面对问题的影
响;
2.假设任务的地点位置不随时间发生变化;
3.假设数据中会员的数量、信誉度不发生任何变化。
三、符号说明
H
任务完成情况
t1
任务密度
t2
会员数
t3
平均任务额度
t4
平均信誉值
t5
定价金额
t6
人均收入
t7
交通状况
四、问题分析
此问题主要研究基于互联网的自助式劳务众包平台内拍照任务的动态定价问题。
首先确定它的任务定价规律,其次考虑多种因素对拍照任务定价的影响,最后自主建立新的任务定价方案,对新的项目进行定价分析。
问题一的分析
本文首先将附件一数据可视化处理,以便进行研究分析,通过观察数据,假设任务的定价与任务周围的区域单位面积内任务完成能力相关;接着将人力的密度、对任务完成情况进行logistic回归分析,验证假设的结果是否正确,并得到任务定价的规律变化;然后将数据放在横坐标不同的二维图像中分析,得到任务定价未完成与哪些因素有关。
问题二的分析
在输出的几个表中,模型系数总和检验表,要看他模型的P值是不是小于,判断我们这个logistic回归方程有没有意义。
通过数据预处理单位面积下的会员信誉值以及任务额度,将上述处理过的数据归纳整合代入附件一中,再将合并后的数据代入spss中进行logistic回归处理得到新的定价方案,经过对比后发现新方案较原方案更有优势。
问题三的分析
实际情况下,打包任务可以减少公司成本支出,目前这一措施被广泛采用,在问题分析中,可将任务为中心点进行距离扩散,根据周围会员离中心点任务的平均距离构建出打包模型进行量化分析,同时综合会员的信誉度以及质量、打包任务的数量及价格,最终考虑打包后模型较之前对任务完成度的影响情况。
问题四的分析
运用问题三的定价分析模型,把附件三信息数据导入,得出不同完成
度下的定价式方案,分别把任务标价以及任务完成度作为横、纵坐标加以分析,利用综合评价模型对不同定价式方案进行排列组合,得到最优以及最差方案的评价值,最终得出最优方案实施办法。
五、模型建立与求解
问题一的模型建立与求解
5.任务定价的规律
本文通过对数据的深入研究及分析,将数据可视化,通过matlab得到三维图像,如下图所示:
注:
(1)红色是完成的任务,蓝色是未完成的任务。
颜色的深浅体现事件发生的频率。
(2)纵坐标是经度,横坐标是纬度。
z轴表示价格
(3)价格为0代表会员的信息,浮动的点表示会员的位置,点的大小表示会员的预定限额。
大致思路是将任务的定价与任务周围的区域单位面积内任务完成能力相关联起来,以构建任务定价与其关系的内在联系。
以可使用人力的密度、任务的价格为自变量,对任务完成情况做logistic回归,
建立图像如下:
5.结果分析
回归的情况,位于0的区域为成功预测结果的情况。
由此可见,任务的定价与任务周围的区域单位面积内任务完成度有关联。
即任务周边可用人力较多时,由于相互竞争激烈,可以将价格定的较低,反之,则人力资源不足时,需要控制价格来吸引周边不多的人力来完成任务,因此,最高价主要出现在人力资源较少的地区。
任务未完成的原因
对数据进行分析整合,分别以纬度,经度为横坐标,任务定价为纵坐标建立二维图像,同时以经度为横坐标、纬度为纵坐标建立二维图像模型,结果如下图:
如图所示,看横轴时,红圈的大小表示劳动力多少。
大的红圈表示可使用劳动力资源较多处,根据定价策略,应当定价较低。
观察蓝色区域(即未完成任务)经度度、114度前后,发现价格较低处未完成任务出现的频次较高,区域颜色明显较深。
由图得出的结论是在对这些任务定价定得过低,对会员们没有足够的吸引力。
根据上面图像可以看出蓝色在空间位置上也有明显的聚集现象(即未完成任务聚集区域),在经度114~和纬度~范围内,大量出现未完成任务。
得到的另一个结论是在该区域定价策略失效,无法对该区域的会员产生足够吸引力。
注:
以上图像构建的编程详情请见附录一
问题二模型建立与求解
在问题分析中,通过数据预处理单位面积下的会员信誉值以及任务额度,并参考道路相对交通通行量进行信息整合将上述处理过的数据归纳整合代入附件一中,再将合并后的数据代入spss中进行logistic回归处理得到新的定价方案,并与原方案进行对比分析。
分析建立模型
通过以上新新方案与原方案的对比,我们可以从表中获取更多因素影响下对定价
规律分析的严谨性,保证考虑多种因素,例如单位面积下的会员信誉值、任务额度以及道路相对交通通行量后对定价分析的评价。
5.模型结果
结论:
最终在加入单位面积下的会员信誉值、任务额度以及道路相对交通通行量参考数据后,新方案相较于原方案对任务定价方案有了进一步的优化,在多种因素影响下,任务定价规律越接近于实际值。
问题三模型建立与求解
实际情况下,任务数量相对集中,会员对任务竞争相对剧烈,本问通过聚类分析,将任务信息打包整合以进行最优化的定价调整。
聚类分析
通过建立经纬度坐标系,如上述问题解答过程。
根据问题注释中所讲,任务分配根据预定限定金额比例所配发,因此需要考虑任务分布的经纬坐标以及会员信息。
由于问题分析中考虑以任务所在位置为中心建立圆心扩散分配距离,考虑圈内会员距离任务中心点的平均距离,加之任务数量、每包任务的数量以及会员的位置、信誉度等因素的影响,考虑圈内会员可能承受打包任务较多。
因此需要根据不同地区的会员情况设置打包上限[1]。
满足聚类的要素:
(1)
经度2纬度2;
(2)nmax以为半径内预定任务限额的众数;
(3)以总体完成度在85%为例,只取个体任务完成的概率在95%的任务点为对象。
得到的聚类树如图所示:
聚类结果图
根据图所示,将任务点根据聚类条件进行聚类,经过综合分析,结果聚类成
5项时效果最佳。
其中,经纬度坐标下的聚类情况表示如图所示:
聚类情况图
上图为根据对应的任务分布情况进行打包任务限制,依据聚类5项条件最佳时的方法对任务统一分析后打包分布,考虑打包后任务密度下降、任务标价金额
会有所下降,因此本文打包最终后的标价为总和的90%。
打包前后对任务完成度的影响情况
附件三的数据运用到问题三构建的任务定价模型当中,通过分析不同完成度的定价式方案,之后在此基础上添加定价金额和完成度双重指标加以分析并进行多目标规划,得到的结果如下图所示:
打包前后完成度和定价金额对比图
如图所示,任务定价方案会对对任务的完成度和定价金额产生影响,如任务完成度为93%时,打包前标价为元;打包后标价为元;任务总金额为6000元时,打包前任务完成度为%,打包后为%;综合总体
数据可得打包处理后的模型不仅可以降低%~%的任务总金额,而且能减少%~%的任务未完成率。
问题四模型建立与求解
对附件三所给的数据进行新的定价分析评价。
利用综合评价得出不同完成度情况下多种任务定价方案。
借此评价模型的效果。
建立新的定价模型方案
在上述问题中,综合考虑聚类分析后各种不同完成度对定价任务方案的影响,具有一定的可实施性,根据所提供的附件新数据逐步进行处理并合理化定价分析。
步骤一:
根据任务所在点距离,通过聚类分析进行打包整合,如图为提取任务点的聚类群落集合图:
样本系统聚类的群落集
将附件4的新项目数据进行分区系统聚类后得到863项任务总数以及401哥打包任务集合。
步骤二:
为了分析不同完成度下的任务定价规律,选取最适合的任务定价方案,将所提供的新数据及其所对应的因素进行分析,其中因素为任务密度t1、会员数t2、平均任务额度t3、平均信誉值t4、定价金额t5、人均收入t6、交通状况t7
步骤三:
为了分析方案的不同实施效果,特将原方案下的不同定价金额同新方案进行对比,建立如表所示:
部分数据在不同方案时的不同定价金额
任务号任务GPS
码纬度
任务GPS经度
原定价方新定价方案新定价方案新定价方案新定价方案
案金额90%~100%80%~90%70%~80%60%~70%
C0001
C0002
C0003
C0004
C0005
C0006
打包任
务1
为了综合评价新方案的分析指标,因此加入任务完成度和定价总金额的双重指标,对上述改进前后方案进行评价,建立如表所示:
双重指标
原方案定价
新定价方案
新定价方案
新定价方案
新定价方案
90%~100%
80%~90%
70%~80%
60%~70%
任务完成度
63%
95%
85%
75%
65%
定价总金额
可依据此两指标,建立双重指标为横、纵坐标的坐标系,通过对新数据的描点绘图,为综合分析评价提供准备数据。
求解综合评价值
本文中考虑两个影响评价结果的指标,即任务完成度和标价金额,看成两条坐标轴,因此可构造出坐标系,将上述待评价的值代入坐标系,通过分析坐标点的位置挑选出最优和最差值。
求出各个待评价方案的坐标点到两个最点之间的距
离,即用Dbest和Dworst表示,随即用B
Dbest
表示评价参考值。
B值越大,
Dbest
Dworst
则表示对应的定价方案评价结果越低[2]。
步骤一:
对上表中数据使用方程进行归一化处理
aij
lij
(13)
i1
nlij
2
并得到归一化矩阵:
d12
d22
A
(14)
d
51
d
52
步骤二:
对上述归一化矩阵进行加权处理,在此问题中,选取权值矩阵Mij
为
1
1
1
1
M
1
1
(15)
1
1
1
1
并获得加权矩阵:
0..1065659
95468
9
E
AM
29598
7
(16)
34636
5
95454
8
步骤三:
从坐标系中挑选出最优值以及最差值,依据矩阵E中选出各项指
标对应参数值的最大值和最小值,可以得到最优方案E[
]和最
差方案E[
];
步骤四:
分别求出各方案与最优方案和最差方案的距离值,即
Di
j1
n(EijE)2
Di
j1
n(EijE)2
(17)
并计算综合评价值
Bi
D
(18)
D
D
i
B值越大,则代表定价方案越好,反之,方案越差。
综合分析评价
通过上述分析得到不同方案相对应的综合评价值,依此进行定价方案的排列顺序。
结果如表所示:
综合分析评价结果对比
定价方案
综合评价值B
定价方案优劣排序
原方案定价
3
新定价方案90%~100%
5
新定价方案80%~90%
4
新定价方案70%~80%
2
新定价方案60%~70%
1
由表可知,任务完成度为60%~70%的新定价方案最优,适合采用。
而任务
完成度为90%~100%的新定价方案由于所消耗的金额过多,所以该方案最不适合采取。
六、模型的评价与推广
模型的评价
模型的优点:
1.运用logistic模型,综合考虑会员位置、信誉度、交通状况等因素的影响,得到的数据拟合程度较好;
2.通过matla建立的三维图像对数据的可视化程度较好,对数据的掌握及分析都具有一定的促进作用;
3.通过聚类分析,对打包的划分有着更明显的作用,对聚类的要素更加清晰
4。
综合评价模型的运用使得本文对定价的划分有了更加深刻的了解。
模型的缺点
1.对会员的位置以及信誉度应用方面不够严谨;
2.未建立会员的位置与任务位置点关系,对数据的处理不够严谨。
6.2模型的推广
本文分析了任务定价与任务经纬度,会员的位置、信誉度以及当地的交通状况等因素的关系。
通过对其分析,我们了解到众包平台的优越性及不足。
对任务定价的动态分析,我们可以加以运用到出租车匹配乘客以及股票市场的变化当中,并加以运用。
七、参考文献
[1]张世强.关于数理统计中系统聚类法的讨论[J].中国卫生统计,2005,(05):
286-289.
[2]何思思.基于改进的TOPSIS模型的长株潭两型社会评价研究[D].中南大学,2010.[1]冯剑红,李国良,冯建华.众包技术研究综述[J/OL].计算机学报,2015,38(09):
1713-1726.
附录
附录一:
clear;clc;closeall;
data=xlsread('','sheet1');
nTask=length(data);
%thenumberoftaskresponse=data(:
4);
x=data(:
1);
y=data(:
2);
price=data(:
3);
response=data(:
4);
%%part1:
datavisualization
figure
(1);
subplot(2,2,1);
color=repmat([100],nTask,1);
color(find(response==0),:
)=repmat([001],sum(response==0),1);
scatter3(x,y,price,price/4,color,'filled');%,'MarkerFaceAlpha',;
title('Scatterplotofthedata');
xlabel('weidu');ylabel('jingdu');zlabel('price');holdon;
%getthecoordinateofthemembers
data2=xlsread('','sheet4');%latitudes/longitudesofmemberscoord=data2(:
1:
2);
weight=data2(:
3);
%%toexludeoutliersofthelocationofthemembers
set_valid=unique([find(and(coord(:
1)>22,coord(:
1)<24));find(and(coord(:
2)>1
12,coord(:
2)<115))]);%dataclean
coord_set_valid=coord(set_valid,:
);
weight=weight(set_valid);
scatter3(coord_set_valid(:
1),coord_set_valid(:
2),zeros(size(coord_set_valid,1),1),weight,[00],'filled');%,'MarkerFaceAlpha',;xlim([2224]);ylim([112116]);
subplot(2,2,2);
scatter3(x,y,price,price/4,color,'filled');holdon;
scatter3(coord_set_valid(:
1),coord_set_valid(:
2),zeros(size(coord_set_valid,1
),1),weight,[00],'filled');
xlabel('weidu');ylabel('jingdu');zlabel('price');
view(90,90);
set(gcf,'position',[1002001400400]);
subplot(2,2,3);
scatter3(x,y,price,price/4,color,'filled');holdon;
scatter3(coord_set_valid(:
1),coord_set_valid(:
2),zeros(size(coord_set_valid,1
),1),weight,[00],'filled');
xlabel('weidu');ylabel('jingdu');zlabel('price');
view(0,0);
subplot(2,2,4);
scatter3(x,y,price,price/4,color,'filled');holdon;
scatter3(coord_set_valid(:
1),coord_set_val