用出租车GPS数据分析深圳道路交通情况.docx

上传人:b****6 文档编号:6616970 上传时间:2023-01-08 格式:DOCX 页数:25 大小:806.08KB
下载 相关 举报
用出租车GPS数据分析深圳道路交通情况.docx_第1页
第1页 / 共25页
用出租车GPS数据分析深圳道路交通情况.docx_第2页
第2页 / 共25页
用出租车GPS数据分析深圳道路交通情况.docx_第3页
第3页 / 共25页
用出租车GPS数据分析深圳道路交通情况.docx_第4页
第4页 / 共25页
用出租车GPS数据分析深圳道路交通情况.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

用出租车GPS数据分析深圳道路交通情况.docx

《用出租车GPS数据分析深圳道路交通情况.docx》由会员分享,可在线阅读,更多相关《用出租车GPS数据分析深圳道路交通情况.docx(25页珍藏版)》请在冰豆网上搜索。

用出租车GPS数据分析深圳道路交通情况.docx

用出租车GPS数据分析深圳道路交通情况

用出租车GPS数据分析深圳道路交通情况(D题)

摘要

本文根据出租车GPS数据,采用聚类分析法建模对交通小区进行动态划分,作出合理的交通小区,采用进行OD推算,做出动态OD矩阵,最后通过交通规划软件TransCAD做出OD时空分布。

首先,对交通出行数据进行优化.抽取出租车载客过程中乘客下车的GPS位置坐标。

基于聚类与交通小区划分的相似性,采用K—Means聚类法进行交通小区的划分。

首先,通过聚类得到交通出行OD矩阵,然后据此划分出交通小区。

这种高实时的交通小区划分方法将对动态的OD估计有着极大的参考价值。

其次,利用矢量图形转换软件FMEUniversalTranslator直接将出租车GPS数据转换到GIS—GoogleEarth中,同时将已经划分出来的交通小区编号导入到GIS-GoogleEarth中,进行数据预处理,得到GPS定位信息表进行OD推算,提取出有效的OD矩阵,再通过TransCAD交通规划软件做出深圳市出租车一日流量图,即OD时空分布。

最后,在第一问和第二问所建立的模型的基础上,针对第三问提出合理的假设进行判断人们出行的OD时空分布。

针对第四问设定合理的拥堵标准,求出拥堵的时段和拥堵路口路段。

综上,我们根据以上的分析实现对深圳市道路交通状况的研究。

 

关键词:

聚类分析OD推算OD时空分布K—Means聚类法

GIS—GoogleEarth

 

一、问题重述

道路交通是国民经济的命脉,是展现一个城市文明与发展的窗口,是提高城市品们,增强城市竞争力的一个重要条件,更与我们每个人的生活息息相关,创造一个畅通有序的交通环境,减少和治理交通拥挤问题是摆在交通管理者面前的一道难题。

一个完整的城市交通系统非常庞大、复杂,这种情况使得交通问题分析求解的困难、复杂度提高。

将完整的城市交通系统按照交通流向、路网布局等特性划分为若干交通小区。

交通小区的划分是分析城市交通刚络的一个很好的方式,因为交通小区内具有相似的交通特征和较强的交通关联性。

交通小区的划分与该城市的人口、面积、经济特征、产业结构等密切相关,并在一定程度上反应了一个城市的吸引力。

在深圳市交通小区划分的基础上,结合该市出租车GPS数据,给出载客出租车的OD时空分布,并在合理的假设条件下,对该市人们出行的OD时空分布进行推断。

最后根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。

从而达到最终的目的,根据模型的求解对深圳市的道路交通情况进行简单的初步分析和判断。

在此,我们给出相关名词的解释。

1.交通小区:

交通小区是具有一定交通关联度和交通相似度的节点或连线的集合,随时间、关联度和相似度的变化而变化,反映城市路网交通特征的时空变化特性。

交通小区具有同质性、关联性、动态性、稳定性、自组织性等特性。

2.OD时空分布:

用于描述城市各个区域之间的交通出行量的分布情况,以交通小区为单位,是交通规划模型的重要组成部分。

3.出租车GPS数据:

提供出租车原始数据,包括经度、纬度、定位时间、车辆状态和其它一些辅助信息。

二、问题一模型建立与求解

针对交通出行数据的宅间分布特征,利用K—Means空间聚类算法[1]进行交通小区的自动划分,为城市交通系统的管理、控制及规划提供技术支持。

一般来说,交通小区的划分应该遵循以下原则:

(1)同质性。

分区内的经济、社会等特性尽量一致。

(2)小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料。

(3)分区数量适当,中等城市不超过50个.大城市最多不超过100-150个。

数量太多将加重规划的工作量,数量太少又会降低调查和分析的精度。

1交通小区划分概况

交通小区面积与人口见表l[2]。

 

表1交通小区面积与人口

区域人口/万人

交通小区面积/km2

交通小区人口/人

范围

平均值

范围

平均值

<7.5

0.28~5.25

1.38

120~2700

872

7.5~15.0

0.60~8.48

2.77

357~1692

954

15.0~30.0

0.60~10.03

3.30

545~2400

1296

30.0~100.0

2.03~25.68

5.55

1316~7175

2828

>100.0

1.45~33.32

7.83

2214~22659

7339

传统的进行交通小区划分的方法主要基于大规模的人工抽样调查。

这种划分方法成本高、周期长.调查的数据存在抽样率低、抽样统计的精度不高、数据更新周期长等问题。

由于我国大部分城市正处于快速发展期,土地利用不断变化,人口高速增长闭,通过这种方式进行交通小区的划分时效性较差。

通过交通出行数据的聚类运算,提供实时的交通小区的分布状态。

这种快速、动态的划分方法弥补了传统划分方式的不足。

2基于K均值聚类算法对交通小区的划分建立数学模型

2.1划分方法

本划分方法首先对坐标数据进行空间聚类运算,得到出行起讫点的OD矩阵,最后以此为依据进行交通小区的划分。

划分具体流程如图l所示:

2.2出租车GPS数据预处理

试验中所用到的数据主要包括车辆GPS实时数据信息。

原始数据表主要保存了出租车上装配的GPS终端所采集的数据,这些数据包括车牌号、采集时间点、经度、纬度、车辆状态、车速、行车方向等。

字段定义见表2:

表2原始表数据定义

字段名

含义

name

车牌号

time

采集时间点(格式:

YYYY/MM/DDhh:

mm:

ss)

jd

经度

wd

纬度

status

车辆状态(0=非打表,即:

空载;1=已打表,即:

重载)

v

车速(单位为:

km/h)

angle

行车方向(0=东;1=东南;2=南;3=西南;4=西;5=西北;6=北;7=东北)

由于每天的数据量庞大,基于缩短数据查询时间以及提高整体运算性能等方面的考虑,需要对原始数据进行筛选、统计、优化。

原始数据内容见表3:

表3原始出租车GPS数据

name

time

jd

wd

status

粤B000H6

2011/4/2012:

15:

30

114.105797

22.558567

0

粤B000H6

2011/4/2012:

16:

08

114.112831

22.558683

0

粤B000H6

2011/4/2012:

16:

30

114.116753

22.558733

0

粤B000H6

2011/4/2012:

16:

38

114.117867

22.558750

0

粤B000H6

2011/4/2012:

21:

30

114.125099

22.569750

1

粤B000H6

2011/4/2012:

22:

30

114.125168

22.569733

1

粤B000H6

2011/4/2012:

23:

00

114.125130

22.569733

1

粤B000H6

2011/4/2012:

23:

38

114.123398

22.569599

1

粤B000H6

2011/4/2012:

24:

30

114.117752

22.569599

1

粤B000H6

2011/4/2012:

25:

00

114.117920

22.573999

1

粤B000H6

2011/4/2012:

26:

00

114.114502

22.582283

1

粤B000H6

2011/4/2012:

27:

38

114.110985

22.587418

0

粤B000H6

2011/4/2012:

28:

08

114.111153

22.587000

0

粤B000H6

2011/4/2012:

29:

02

114.113548

22.583567

1

粤B000H6

2011/4/2012:

29:

10

114.114136

22.582550

1

粤B000H6

2011/4/2012:

29:

32

114.114830

22.579983

1

粤B000H6

2011/4/2012:

30:

02

114.116982

22.576082

1

粤B000H6

2011/4/2012:

33:

06

114.125549

22.552900

0

粤B000H6

2011/4/2012:

33:

36

114.128120

22.556084

0

粤B000H6

2011/4/2012:

36:

41

114.131714

22.561617

0

其中status字段代表的是出租车的空重车状态,当值为O时表示车的状态为空车,值为l时表示车的状态为重车。

当status值由0变为1时,status值为l的车的位置即为乘客上车时的位置;相反地,乘客下车时的位置也可以得到。

根据这一特性剔除原始表中的无用数据,优化后的数据见表4:

表4优化后的数据

name

time

jd

wd

status

粤B000H6

2011/4/2012:

16:

38

114.1179

22.55875

0

粤B000H6

2011/4/2012:

21:

30

114.1251

22.56975

1

粤B000H6

2011/4/2012:

27:

38

114.111

22.58742

0

粤B000H6

2011/4/2012:

29:

02

114.1135

22.58357

1

粤B000H6

2011/4/2012:

33:

06

114.1255

22.5529

0

2.3聚类模型求解

经过上一步的数据优化,即可得到由起讫点数据组成的据集。

现在需要对这些数据进行聚类运算:

一段时间内的起点或者讫点被划分为若干个区域。

每个区域中的点分布紧凑,区域与区域之间自然分开。

我们采用了K—Means聚类算法。

K—Means聚类算法是一种分割式聚类方法.它是数据挖掘技术中一种经典的基于划分的聚类算法。

其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进行后续的处理。

K—Means算法采用了迭代更新的运算思想,聚类过程如下:

首先从n个数据点随机选择k个点作为初始聚类中心;通过运算其它点与这些聚类中心点的相似度(距离),将其分别分配给与其相似度最高(距离最近)的中心点所在的聚类;然后对划分好后的聚类重新运算聚类中心。

这一过程不断重复直到标准测度函数开始收敛。

K-Means聚类算法Matlab的实现代码在附录中给出。

2.4模型边界值运算处理

聚类运算结束之后,得到若干组包含中心点在内的一些坐标点,如图1、2所示(点x表示出租车的坐标点,实心圆点表示交通小区中心)。

图1经纬度坐标点模拟

图2坐标点

将所有聚类后的坐标通过GIS平台输出,通过这种方式很难看出不同区域之间的界线。

这时需要将区域的边界绘制出来。

本文采用的边界运算过程如下:

首先建立平面直角坐标系.将坐标系以(0,0)为中心点均分为n等份区域(n的值将决定边界运算结果的精度)。

每个区域的角度为360/n。

如图3所示:

图3360度分为n份

然后,将某个聚类的点集放入该坐标系,使得区域中心点与坐标原点重合。

通过计算其它点与中心所形成的角的正、余弦,即可得到每个点与中心点所形成的夹角。

进而将这些点归入上一步所划分的区域。

依次计算第i个区域里每个点距离中心点的距离,记录距离中心点最远的点为Ci。

如图4中P点等。

图4距离中心点的距离

最后,将这所有的Ci点相连接,即可得到点集的相应边界,如图5所示。

图5边界点相连

最后,通过上述方法,利用Matlab工具对原始数据进行优化处理以后,可以得到最终的小区划分。

小区点的具体坐标在附录中给出。

图6交通小区分布图

2.5模型一评价

模型一通过对出租车GPS数据进行聚类运算,快速计算出不同时间段内出租车载客OD矩阵,进而将划分好的区域在GIS平台中显示出来。

从实验结果可以看出:

这种划分方法能够反映出不同时间段内交通小区的绝对动态性以及相对稳定性的特征,对城市交通小区的划分具有很高的参考价值。

但不可否认所使用的交通小区划分方法也存在一定的不足:

1)划分算法使用了纯粹的K—Means空间聚类法,没有与现有的位置属性相结合,比如住宅区、商业区等属性;

2)其次,算法没有对出租车的特殊数据和异常数据进行处理,比如红绿灯停车、GPS信号机发生故障等情况,这些都将影响最终结果的准确性;

3)最后,针对特定时间段进行交通小区的划分更有代表性。

比如早晚高峰等,本文没有对此展开讨论。

这些都是今后的改进方向。

三、问题二模型建立与求解

针对问题二,我们从一中已经划分完成的交通小区作为出发点,基于出租车GPS数据和地理信息系统GIS,通过使用FMEUniversalTranslator矢量图形转换软件和Excel-VBA宏,实现出租车OD矩阵推算,从而做出OD时空分布,对以后深圳市客流分析、城市规划和道路交通运行质量有重要意义。

1出租车GPS的基础数据分析

出租车GPS定位信息表见表2和表3.

1.1出租车GPS定位数据基本假设

(1)忽略时间间隔△t

卫星每隔△t(s)接收到出租车GPS信号接收机发出的一次新的运营状态信号,我们假设这个间隔△t足够小,即认为信号接收是连续的。

那么,在这个间隔期内出租车一直保持上个接收到的车辆状态继续运行。

(2)“载客”状态连续

假设最小“载客”状态的持续时间大于卫星接收间隔时间△t,即:

总是出现连续的“载客”状态。

以下提到的“载客”状态都是特指连续“载客”状态。

2基于GPS的出租车OD矩阵推算[3]

基于GPS的出租车OD矩阵推算是利用GIS的各种运算功能(如属性编辑、叠合处理等)和Excel-VBA软件,将出租车GPS原始数据转换为出租车OD矩阵的一种方法。

这里所需的出租车GPS原始数据必须是一个城市的全样或抽样的出租车在一年中最具代表性的一天24小时的运营数据。

2.1数据预处理

1)统一文件格式

由于出租车GPS数据以Maplrffo的格式存储,城市小区划分与编号数据以AutoCAD的格式存储,所以我们必须采用矢量图形转换软件FMEUniversalTranslator将他们转换为GoogleEarth的文件格式,即所需要的统一文件格式。

其中,FME(FeatureManipulateEngine)Suite是加拿大SafeSoftware公司推出的用于不同数据格式之间转换的一种方法,该方法基于OpenGIS组织提出的新的数据转换理念“语义转换”,通过提供在转换过程中重新构造数据的功能,实现了超过100种不同空间数据格式(模型)之间的相互转换。

2)匹配小区编号

首先在统一格式后的出租车GPS数据文件中添加小区编号属性,然后将此文件和城市小区划分及编号的文件一起加载到GoogleEarth中,再根据每个出租车GPS记录点的空间坐标,通过GIS的匹配运算得到各个记录点所在的小区,最后将该小区的编号记录到GPS数据文件的小区编号属性列。

3)重新排列GPS定位信息表

出租车定位信息表是出租车GPS数据的另一种表现形式,是以Excel的格式存储。

它里面的数据是按照接收时间的倒序排列,显示在前面的记录是最新接收到的,所以要进行重新排序。

首先对所有记录顺序编号,再对编号列重新排序,使用降序排列并扩展选定区域,使得显示在前面的记录是最早接收到的。

4)判定出行的起讫点

在GPS定位信息表中,出租车一次出行的记录是一系列连续的“载客”状态记录点的集合,且第一个“载客”记录点为本次出行的起点,最后一个“载客”记录点为本次出行的终点。

2.2OD推算

假设小区编号依次为1,2,…N。

构建初始出租车OD矩阵

;出租车出行总次数记为K,K是有限正整数;第k次出行产生一个累加OD矩阵

;i=l,2,…,N:

j=l,2,…,N。

其中

则有效OD矩阵提取的具体步骤为:

Step1:

令k=l,指向定位信息表的第一行;

Step2:

寻找第k次出行的起点,记录下该点的定位时间乃和小区编号I;

Step3:

寻找第k出行的终点,记录下该点的定位时间%和小区编号j;

Step4:

由上两步得到累加OD矩阵:

,并更新出租车OD矩阵:

Step5:

若还有“载客”状态的记录,则令k-k+1,并返回到Step2,进行循环提取,否则进入下一步;

Step6:

输出出租车OD矩阵

2.3出租车OD矩阵处理

根据2.2节OD推算出的深圳市全样OD矩阵,进行现状分析得出该市出租车一日出行OD总量。

最后运用交通规划软件TransCAD计算出该市出租车一日流量。

具体流程见下图:

 

表5即为出租车的GPS定位数据信息:

 

表5深圳市出租车GPS定位信息表

name

time

jd

wd

status

v

angle

粤B000H6

2011/4/2012:

15:

30

114.105797

22.558567

0

54

1

粤B00F27

2011/4/2311:

23:

29

113.989464

22.558767

1

71

2

OD矩阵见表6:

表6OD矩阵

0D

1

2

3

4

5

6

7

8

9

1

1249

690

674

543

347

347

254

346

326

2

3560

6532

945

132

6484

257

332

253

664

3

640

5830

8127

5430

7936

654

525

654

532

4

284

574

4674

3542

640

356

463

547

635

5

146

5308

8690

342

8956

546

653

632

255

6

107

1490

356

241

353

854

235

543

565

7

462

6489

2468

1247

5463

676

437

322

356

8

784

456

547

807

653

246

654

321

545

9

624

914

253

352

743

154

363

563

537

按图7中所示的操作流程,先将200辆出租车的GPS数据推算为样本量的OD,再经放样、校核和TransCAD分析与计算等操作,最终得到了深圳市出租车现状一日流量,见下图:

图8深圳市出租车现状一日流量

3模型二评价

在本次出租车OD的调查分析中,我们灵活地使用了目前已有的智能设备。

与传统的调查相比,此方法可以省去出租车OD表的设计、印制、发放、填写、录入等过程。

从很大程度上节省了人力、财力,提高了劳动效率。

出租车OD是客流分析的重要组成部分,但出租车OD的获取却相当不易。

我们以充分利用现有出租车信息资源为目的,首次提出利用矢量图形转换软件FMEUniversalTranslator直接将出租车GPS数据转换到GIS—GooleEarth中,并推算出出租车OD矩阵的思想,进行了详尽介绍。

此次所提出的方法将为生成出租车OD提供一种全新的思路。

该方法是现代智能设备在交通规划调查中的一次试验使用,并为GPS的使用开创了新的领域。

四、问题三的解答

针对问题三,在一个城市里,人们的出行行为对整个交通的管理和控制起着非常重要的作用。

国外关于居民出行行为的研究较早,利用集计的方法,将研究范围划分成多个交通小区.以小区为研究的基本单元将出行者的交通行为进行集体统计分析。

1.人们出行行为的分类[4]

人们的出行分为刚性出行与柔性出行两种,诸如上班、上学等刚性出行由于其日常性的反复,将会形成出行路径的详细信息.从而形成各自的交通方式选择模式。

这种情况下人们的出行方式选择比较容易确定。

相反,柔性出行(包括购物、访友等)不会一成不变地沿用一种出行形态,此时人们出行时具体选择哪一种出行方式与很多因素相关。

人们出行方式选择是个决策过程,与人们的出行意愿、费用、交通基础设施建设水平等主要因素相关。

其中任何一个因素的变化都有可能使人们的出行方式选择产生变化。

2.人们出行选择交通方式的影响因素

(1)出行目的:

通常人们在日常性的刚性出行时,通常重视出行的可靠性.需要快速、准时地到达目的地,对于时间和费用的要求较严格。

相反,弹性出行具有很强的随意性和自由性,故对时间和费用的要求都比较低,追求的是出行的舒适度。

(2)出行时间——高峰期与非高峰期:

高峰时期人们更倾向于出租车这类便捷的出行方式。

相反,在非高峰期人们更追求一种经济实惠的出行方式。

(3)出行地区特性:

出行方式的选择与出行地区的特性有着明显的关系,主要包括地区的经济水平、居住人口密度、公共设施条件以及旅游资源等。

一般经济繁荣、公共设施齐全或者旅游资源充足的地区,交通设施会比较完备。

3.合理假设

(1)假设一个交通小区的出行产生量和另一个交通小区的出行吸引强度密切相关。

(2)假设各个小区的抽样率在3%~5%,且各小区的抽样率所存在的差异极小。

(3)假设所有营运过程中的出租车始终在载客和空驶两个状态之间变换,不考虑在一个地方停留的情况。

(4)载客状态下出租车的旅行目的服从乘客的旅行目的;空驶状态下出租车的旅行目的地的选择有很大的随机性,服从于驾驶者对下一个乘客需求点位置的判断。

4.人们出行的OD时空分布的推断

出租车是城市客运交通的一个不可或缺的组成部分,同时也是除公交以外人们出行方式的另一经常性的选择。

而现在随着人们生活水平的提高,对生活质量要求的提升,也促使着出租车数量的不断增长。

所以出租车交通量已成为城市道路交通总量中的重要组成部分,陈盛2002年对蚌埠市结果显示,蚌埠市典型交叉口的出租车交通量在交通总量中所占的平均比值高达33.52%,如此大比重的交通出行量,已成为影响城市道路交通分布及分配预测准确性的重要因素之一。

所以,出租车的OD时空分布在一定程度上可以反映人们出行的OD时空分布。

具体见下图图9:

图9人们出行流量图

5.问题三求解结语

但是在现实生活中,人们出行方式的选择有多种多样,影响人们对出行方式选择的因素也是多种多样。

由于在一些繁华的地段以及生活之间都会有比较完善的交通设备,同时随着人们的环保观念的提升以及考虑到经济实惠等方面,大多数人对出行方式的首选还是公交。

因此以出租车的OD时空分布来推断人们出行的OD时空分布还存在着一定的误差。

五、问题四模型建立与求解

针对问题四,交通拥堵已经成为制约城市发展的瓶颈,不仅影响着城市经济的发展,也影响着人们的工作和生活效率。

1.合理假设

(1)路口不发生交通事故,且所有司机都自觉地遵守交通规则和调度规则。

(2)同一转向的出租车通过交叉口的平均速度相同,通过路口的时间也相同。

(3)在出租车平均时速为15公里/小时和出租车在行驶过程中等待时间在大于1个小时的情况下可视为交通拥堵时段和路段。

2.数据处理

2.1.原始数据见表3

由于本题只需根据出租车载客后的行驶数据进行问题的求解。

所以对原始数据进行进一步的优化。

优化后的数据见表7:

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 工作计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1