全国大学生数学建模竞赛B题全国优秀论文3Word文件下载.docx
《全国大学生数学建模竞赛B题全国优秀论文3Word文件下载.docx》由会员分享,可在线阅读,更多相关《全国大学生数学建模竞赛B题全国优秀论文3Word文件下载.docx(32页珍藏版)》请在冰豆网上搜索。
实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的补贴方案。
请你们搜集相关数据,建立数学模型研究如下问题:
(1)试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。
(2)分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?
(3)如果要创建一个新的打车软件服务平台,你们将设计什么样的补贴方案,并论
证其合理性。
二、模型假设
(1)不考虑出租车换班时不接单以及拒载对大数据的影响;
(2)假设所有安装有打车软件的司机不设置接单范围;
(3)假设网络共享的数据真实可靠;
(4)假设打车软件的使用率c为80%;
三、符号说明
x出租车分布的数量(辆);
t被抢单时间(秒);
z装有打车软件的打车客户需求量(人);
h打车平均难易程度;
P打车客户总需求量(人);
M车费;
aY2的权重;
bt的权重;
L车里程利用率(%);
c打车软件的使用率,c0.8;
Y服务的满意度;
YY的倒数;
21
F匹配程度函数;
W出租车万人拥有量(辆);
M车辆满载率(%);
k补贴等级1,最少
k补贴等级2,中等
2
k补贴等级2,最多
3
四、数据处理
4.1对地区的分析与选定
截止2015年8月,中国地区共有23个省,四个直辖市,两个特别行政区,五个自
治州。
其中,我国23个省中分布有一线、二线、三线、四线等城市共计661个。
在如
此庞大的城市数据群的基础上,选择一个合适的城市进行深入调研,是进行出租车优化
过程的第一步。
一个合适的调研城市,有利于提高优化模型的精确性,增强模型应用的
广泛性。
选定城市后,针对该城市不同地区的特点进行地区划分与时间段的选取,是对
出租车供求匹配程度进行分析的第二步前进方向。
4.1.1杭州地区的选定
地区选取标准:
(1)经济发达,有足够规模大数据进行分析假设;
(2)影响范围广,有条件进行出租车供求匹配的优化;
(3)出租车万人拥有量或里程利用率居全国各城市的中等或中等偏下水平,保证
可以代表我国的绝大部分水平,并有足够空间进行问题分析与优化;
综合上述选取标准,本文初步决定围绕杭州进行调研。
为验证其合理性,本文特分
别在我国一线、二线、三线等城市中随机选取15个城市:
北京、武汉、杭州、宁波等
(XX百科)通过EXCEL等软件对其主城区出租车拥有量(辆)、主城区人口(万人)、
出租车万人拥有量(辆)、里程利用率等进行柱形图对比分析,见图1、图2、图3、图
4(详细数据见附录9.1):
图1:
各城市主城区出租车拥有量
图2:
各城市主城区主人口
图3:
各城市出租车万人拥有量
图4:
各城市出租车里程利用率
4
衡量出租车供求的三大指标为里程利用率、车辆满载率、出租车万人拥有量。
里程利用率指营业里程与行驶里程之比,
L
营业里程(公里)
x100%
行驶里程(公里)
出租车万人拥有量表示一定城市规模内车辆占有量,是人均设备普指标。
W
主城区出租车数(辆)
主城区人口(万人)
车辆满载率是载客车数与总车数的比例关系反映出租车的供求匹配程度[1],
M
载客车数(辆)
总通过车数(辆)
结合图1-图4可知,杭州市作为经济发达城市,二线城市中的领头羊,出租车万人
拥有量a为19.6(辆/万人),位居15个城市中的12位,而里程利用率L以69.25%则
位列第六位。
在无各城市各时间段、各地区详细数据,所有城市均不考虑车辆满载率的
情况下,结合各城市的a与L数据分析可知:
杭州的出租车供求匹配程度并不高,且尚
未达到其应有的水平。
因此,杭州符合之前规定的选取标准。
故本文将以杭州为调研地
区进行数学建模,验证其出租车资源的供求匹配程度关系,优化出租车供求匹配问题。
4.1.2西溪湿地地区与西湖地区的选定
图5:
杭州人流量最大地点示意图[2]
5
如图5所示,杭州人流量最大的几个地点中,西溪湿地与西湖名列其中。
西溪湿地
与西湖风景区是杭州的门户风景区,不仅受到外地游客的欢迎,更是本地居民休闲娱乐
的好去处。
因其独特地理位置、文化底蕴而导致的人流量高居不下等特点,符合数据样
本地区选取的规则。
因此选择西溪湿地附近与西湖风景区附近作为杭州地区内选择的第
一处样本点,可以在一定程度上反映城市景区附近出租车供求匹配程度的大小。
4.1.3火车东站地区与汽车南站地区的选定
火车东站与汽车南站是本文选取的杭州地区第二处数据样本点。
杭州火车东站号称
“亚洲第一”铁路枢纽,站内汇集高铁、普铁、地铁、公交、出租、大巴等多种交通方式
和配套服务设施于一体,并可实现立体无缝交通换乘。
东站针对出租车出行的乘客专门
进行了特殊的设计。
地下到达/换乘层(地下一层),南北共设了6个出租车上客点,北
侧3个,南侧3个。
而坐出租车过来的乘客,可以直接通过新塘路上匝道和王家井街上
匝道,直接到出发层,进入候车大厅。
截止至2014年,东站客流量已高居全国第三。
杭州汽车南站是杭州市最早投入服务的汽车站之一,日均发送班次近500班,出口高达
1.1万余人每天。
杭州东站与汽车南站的每日客流量大,出租车分布较密集。
选取杭州
东站与汽车南站作为数据样本点,既有针对性又可与其他人流密集地区进行对比,进行
多层次分析。
4.1.4武林广场地区与黄龙体育馆地区的选定
武林广场商圈与黄龙体育馆地区是杭州市办公场所较集中的两个地区。
由图5可知,
武林广场地处杭州繁华地带,服务业完善、各大公司林立;
黄龙体育馆是杭州本地群众
以及外来游客访问量较大的场所之一,其完善的演唱会设施以及附近的散客中心为黄龙
体育馆附近的人流量做出了很大的贡献。
因此,除景区、交通枢纽外,武林广场与黄龙
体育馆附近地区可作为本文中第三处数据样本点进行计算。
4.1.5德胜社区与舟山东路附近地区的选定
在选取了西溪湿地与西湖风景区地区、火车东站与汽车南站地区、武林广场与黄龙
体育馆地区三块数据样本地区之后,本文的第四块数据样本地区选择在德胜社区附近与
舟山东路附近地区。
景区、交通枢纽、商圈与住宅区,掌握这四块地区的交通数据可较
为全面地了解该城市的交通状况。
住宅区人口较固定且出行有一定规律,因此选取住宅
区做为第四处数据样本地区,同时可将住宅区数据做为其他样本地区数据样本的对比数
据,弥补了其他三组数据样本地区的不足,使数据样本更加完善。
6
4.2对基本数据的处理分析
4.2.1打车客户总需求量P
基于苍穹智能出行平台的大数据,分别选取9.7日杭州四块数据样本地区早高峰
(7:
00-9:
00)、晚高峰(16:
00-18:
00)、平常时间(10:
00、15:
00、20:
00)三个时间段
的持有打车软件的客户需求量z,见表格1:
表1:
所截取各样本地区9.7日不同时间段z的大小
时间段
附近
西湖风
景区附
近
火车东站
汽车南站
武林广场
黄龙体育馆
德胜社区
舟山东路附
近(下城区)
7:
002512131114
8:
001084112181110
9:
0039871111111
16:
0051413123201518
17:
0036110114111
18:
007511842111
10:
0017726179149
15:
00134218431124
20:
003512111114
假设打车软件的使用率c0.8,故打车客户总需求量
P
z
c
(1)
将P相关函数与表1相关数据带入计算软件中进行计算,得出结果有:
表2:
所截取各样本地区9.7日不同时间段P的大小及其平均值E(zc)
西湖附
0031.251.252.5016.251.251.251.255.00
00135.005.0013.7526.2510.001.251.2512.50
00497.508.751.251.251.2513.751.251.25
E(zc)221.255.005.8314.584.175.421.256.25
0063.755.0016.251.2528.7525.0018.7522.50
0045.001.2512.501.2517.501.251.251.25
0093.751.251.2510.0052.501.251.251.25
E(zc)67.502.5010.004.1732.929.177.088.33
13:
00221.252.507.501.258.7511.251.2561.25
14:
0016.255.002.5022.505.0038.751.2530.00
0043.751.252.501.251.251.251.2517.50
E(zc)93.752.684.178.335.0017.081.2536.25
7
4.2.2出租车服务满意度
Y以及车辆分布数量x
基于苍穹智能出行平台的大数据,同样选取数据出租车分布量—x,作为计算满意
度Y的数据来源。
已知x与z相关数据,x相关数据见表3,z相关数据见表1。
表3:
所截取各样本地区9.7日不同时间段x的大小及其平均值E(x)
时间西溪湿地附西湖火车东站汽车南站武林广场黄龙体育馆德胜社区舟山东路附
段近附近附近附近附近附近附近近(下城区)
00404.001.00813.00527.00216.001.00260.00322.00
00355.001.00792.00200.00261.001.00353.00403.00
001.001.00839.00206.00208.001.00135.00168.00
E(x)253.331.00814.67311.00228.331.00249.33297.67
00835.001.00595.00441.00261.00369.00496.00449.00
001014.001.001014.00111.00562.00145.00234.00273.00
00813.001.00772.00283.00196.001.00270.00492.00
E(x)887.331.00793.67278.33339.67171.67333.33404.67
00143.001.00223.00267.00106.001.001.00281.00
00503.001.00491.00221.00213.00173.00288.00394.00
00446.001.00772.00455.00921.00383.00582.00290.00
E(x)364.001.00495.33314.33413.33185.67290.33321.67
服务满意度Y在一定程度上与E(zc)成正比,与E(x)成反比,三者相互之间关系式
为:
z
E()
c
Y
1Ex
()
(2)
将E(z/c)与E(x)相关数据带入公式
(2)中进行运算,得出结果由表4所示。
8
表4:
一天当中不同时间段满意程度Y1的大小
西溪湿
地附近
西湖附近
火车东
站附近
汽车南
武林广
场附近
黄龙体育
馆附近
德胜社
区附近
舟山东路附近
(下城区)
00
000.875.000.010.050.020.180.010.02
000.082.500.010.010.1018.730.020.02
000.262.680.010.030.0110.870.000.11
4.2.3被抢单时间t的整理计算
被抢单时间t表示客户使用打车软件下单后被出租车司机接单的时间大小,可在一
定程度上反映打车的难易程度。
根据苍穹数据平台的数据统计显示,选取9.7日杭州地
区四块数据样本地区三个不同时间段t的数据有:
表5:
一天当中不同时间段被抢单时间t(秒)的大小
0076.4238.670.0067.83022.330.0028.67
0042.282.0026.0055.3374.51620.330
0071.672.0012.009.89010316.17
五、问题一的分析、模型建立与解决、评价
5.1问题一的分析
问题一要求搜集相关数据,建立合适指标,对不同时空的出租车资源进行“供求匹
配程度”的分析。
由于出租车始终处于动态变化中,不同空间不同时间都会产生不同的
数据,所以可选取特定的地区与时间段进行对比,并运用数理统计与分析确定多处数据
样本地区,得到具有多样性和普遍性的数据样本。
最后,使用主成分分析法进行建模,
9
确定指标以及不同时空的出租车资源“供求匹配程度”分析。
5.2问题一的模型建立与解决
5.2.1问题一模型的准备与指标选择
为能更好地分析杭州地区不同类型地区的出租车供求匹配程度,本文特选定商圈、
交通枢纽、住宅区与景区四块具有特点的地区做为数据样本地区。
在空间多样性的基础
上,同时记录同一地区不同时间段的相关数据,以达到时间角度的数据多样性。
通过对不同地区数据分析,本文决定通过主成分分析法,选用客户使用打车软件的
Y作为第二项判被抢单时间t作为第一项判求出租车资源“供求匹配程度”的指标,
Y
求出租车资源“供求匹配程度”的指标进行分析与比较。
简单来说,主成分分析法是对相关性强的两个或多个变量数据进行相关矩阵或协方
差矩阵内部结构关系的研究。
在问题一中,第一指标y与第二指标Y做为模型中的两个
主成分,均满足主成分的基本要求:
1.每一个主成分都是各原始变量的线性组合;
2.主成分的数目大大少于原始变量的数目;
3.主成分保留了原始变量绝大多数信息;
4.各主成分之间互不相关;
故使用主成分分析法明确第一指标y与第二指标Y之间的函数关系,即,使用主成
分分析法确定第二指标
Y与t第一指标两者之间的权重比例。
5.2.2问题一模型的建立
首先对所有变量包括x,y,z等进行统一处理,整理成表格形式,见表1、表3、表5。
分别将带入公式
(1)、公式
(2)中,得到表2与表4中的数据P与T。
z
P
(1);
1()
Y2;
E)
(x
其次进行目标函数的确定:
可以知道,匹配程度函数F与Y,t
1有一定的比例关系。
已知Y1,t为两个相互独立的
变量,其中
Y表示为打车总需求量/总需求量,与F成正向关系;
t表示被抢单时间,与
F成反向关系。
故为了方便计算与讨论,特引入Y的倒数Y,使得两个指标的变化方向
12
一致,来确定F的函数。
10
F
(3);
aYbt(4);
其中a,b分别为Y2,t的权重系数,可由主成分分析法近似得到。
在确定了目标函数后,进行约束条件的确定:
在运用主成分分析法时,普遍认为选择原则为特征根>1,且累计方差贡献率>
80%。
在本题中,即:
1.若Y<1,因不符合城市规划的正常情况,故舍弃此情况。
假设此种情况不存在。
2.若Y>1,满足主成分分析法中的特征根>1的情况,由此继续进行分析:
(1)若t=0,即被抢单时间为0,此时无打车软件正在使用,分为两种情况:
(ⅰ)此时有零辆出租车正在运营。
然而结合实际情况来看,这种情况可以直接被
否决。
出租车分早、晚、夜间班等,不存在零辆出租车运营的情况;
(ⅱ)此时有零人使用打车软件,即此时所有出租车都是在使用传统运营方式进行
运营。
故此时匹配程度函数F只与Y有关。
但目前在中大型城市中,打车软件的普及率
已经高达80%,故此种情况不可能存在。
(2)若t>0,此时Y>1且t>0,满足主成分分析法的要求,则以此为约束条件
进行建模运算,运用spss软件,解出最终解。
5.2.3问题一模型的解决
运用spss软件解决上述模型问题,将相关数据带入模型中可得:
假设本题适合主成分分析,基本可以用主成分分析求权重。
结果如下(原图见附录
9.4):
图6:
解释的总方差
由图6可知,1,2两个主成分对应的特征根>
1,2个主成分的累计方差贡献率达到
11
64.454%。
因此前2个主成分基本可以反映全部指标的信息。
因只有Y特征值为1.289
>1,故选取Y为主成分。
假定取累计方差率64.454%与35.546%做为权重有:
2t
F;
0.64454Y0.35546(5)
5.2.4问题一结果的分析
将
Y与t的数据回带到F0.64454Y20.35546t中,得出如下数据:
表6:
各地区匹配程度函数F数据一览表
舟山东路
附近(下
城区)
早高峰27.9013.8790.0137.8635.328.06128.5640.89
晚高峰23.500.9760.4062.7233.1317.7637.5631.30
平时27.980.9580.8927.8353.2810.56160.727.91
通过对数据的整理,本文将匹配程度函数F的值分为五个等级,依次对应不同的难
度,这五个等级分别是:
表7:
等级分配表
等级1:
极易0-20
等级2:
易20-35
等级3:
中等35-70
等级4:
难70-100
等级5:
极难>
100
将匹配程度函数F的数值等价兑换为等级有:
表8:
各地区匹配程度函数F等级一览表