城市大规模时空大数据的可视化研究以出租车载客记录簿为例论文设计.docx
《城市大规模时空大数据的可视化研究以出租车载客记录簿为例论文设计.docx》由会员分享,可在线阅读,更多相关《城市大规模时空大数据的可视化研究以出租车载客记录簿为例论文设计.docx(10页珍藏版)》请在冰豆网上搜索。
城市大规模时空大数据的可视化研究以出租车载客记录簿为例论文设计
项目名称城市大规模时空数据的可视化研究-以出租车载客记录为例
项目负责人(签名)_________________________
所在学校(盖章)___________________________
研究类别”含义:
基础研究:
指为获得关于现象和可观察事实的基本原理及新知识而进行的实验性和理论性工作,它不以任何专门或特定的应用或使用为目的。
应用研究:
指为获得新知识而进行的创造性的研究,它主要是针对某一特定的实际目的或目标。
试验发展:
指利用从科学研究和实际经验中所获得的现有知识、生产新材料、新产品、新装置、新流程和新方法,或对现有的材料、产品、装置、流程、方法进行本质性的改进而进行的系统性工作。
推广应用、科技服务:
指与研究与发展活动相关并有助于科学技术知识的产生、传播和应用的活动。
研究
项目
项目名称
城市大规模时空数据的可视化研究-以出租车载客记录为例
研究类别
2
1.基础研究2.应用研究3.试验发展4.推广应用5.科技服务
依托的一级学科
计算机科学技术
成果形式
论文+报告
起止时间
2014年4月到2016年5月
经费
申请总额
2万元
其他经费及其来源
项
目
负
责
人
姓名
职称
工作单位
电子
项除
目负
组责
主人
要外
成五
员名
职称
学位
专业
工作单位
承担任务
本人签名
项目负责人近三年来承担的研究项目
项目名称
项目来源
起止年月
排名
进展
高校学生微博使用行为大数据分析研究
市教育规划项目
2014.4-2015.4
1
立项
慈溪市物流公共信息平台建设研究
慈溪市社会科学项目
2013.6-2014.6
1
中期
智慧物流关键技术及优化研究
校高级别预研项目
2012.10-2015.10
1
中期
基于学习成果展示的先学后教课堂教学模式研究
校教学改革项目
2013.12-2015.12
1
进行
市质量监督局江北分局改版及维护
市质量技术监督局
2013.12-2014.12
3
进行
RFID环境下网络攻击的防御方法
新汇信息科技
2013.7-2014.6
4
中期
项目负责人为第一署名人的代表性成果
成果名称
成果来源
获得时间
排名
等级
extension-basedclusteringmethod:
anapproachtosupportadaptabledesignoftheproduct
MSEC论文
2007.10
1
EI
Extensionadaptivemethod:
AnApproachtosupporttheconfigurableLayoutdesign
icmlc论文
2010.7
1
EI
Optimizationinlogisticsdistributionbasedonextensioncodedparticleswarmalgorithm
Iccsnt论文
2012.2
1
EI
ModifiedParticleSwarmAlgorithmforVehicleRoutingOptimizationofSmartLogistics
Icmic论文
2014.3
1
EI
基于agent的紧急状态救援行为模型仿真
工业安全与环保
2014.3
1
核心期刊
1.本项目研究意义及国外同类研究工作现状(附主要参考文献及出处):
项目的研究意义
城市运行和管理中累计的大规模数据,其样本嵌于连续空间,在时间和空间上存在着很强的自相关性。
项目以出租车GPS数据为研究对象,结合交通地图,通过数据挖掘和可视化技术对交通小区划分、人们出行的OD时空分布显示,拥堵路段时段分析等研究容进行了有效研究。
力求揭示出租车时空数据中的涵价值和演化规律,为城市交通管理决策提供重要的数据价值和参考意义。
国外同类研究工作现状
近年来,国外众多学者应用时空数据挖掘和可视化的方法,对出租车数据的使用进行了深入的研究。
NivanFerreira(2013)教授带领他的研究组,开发了一个出租车OD数据分析系统TaxiVis,系统,能够对纽约地区的三年的出租车数据进行流畅的探索式分析,并且查询操作完全图形化,简单直接。
①
N.Andrienko等人对可移动数据的挖掘和可视化方法、工具和实验进行了全面梳理,指出了对于大规模时空数据利用的分析流程和发展趋势。
②
C.Peng等人从人类集体流动模式的角度出发,结合所在城市地区出租车行驶数据,对面向人群进行了时空显示和分析。
③
郭雪婷等(2013)以市某一地区的出租车GPS实测数据为例,运用边界矩形法识别道路,划分拥堵标准,并根据各道路的拥堵隶属度确定其拥堵级别以及拥堵的时间段,建立了道路拥堵判别模型。
④
蔡毅(2013)从市出租车GPS海量数据中,提取部分数据对市市域进行交通小区的划分,利用相应的数据挖掘软件结合聚类分析方式对其进行分析,最终将分类数据进行了可视化。
⑤
程志华(2013)就乌鲁木齐市出租车GPS数据进行研究,调查分析乌鲁木齐市道路交通运行基本状况,探讨出租车GPS数据挖挖掘应用方法的同时,为乌鲁木齐市交通规划、建设和管理提供参考。
⑥
以上学者主要针对出租车时空数据的使用领域和分析方法进行了较全面的研究,除此之外,还有不少学者专门针对城市出租车移动数据应用的理论框架、预测管理、高性能时空挖掘算法等方面的进行了研究分,也有学者以符号学,图形学为基础来研究出租车时空数据的表示和聚集,研究层面相对较为广泛。
[1]NivanFerreira,JorgePoco,HuyT.Vo,JulianaFreire,andClaudioT.Silva,VisualExplorationofBigSpatio-TemporalUrbanData:
AStudyofNewYorkCityTaxiTrips[J],IEEETrans.VisualComputingGraph,2013,19(12):
2149-2158
[2]M.Veloso,S.Phithakkitnukoon,C.Bento,P.Olivier,andN.Fonseca.Exploratorystudyofurbanflowusingtaxitraces.InFirstWorkshoponPervasiveUrbanApplications(PURBA),2011.
[3]C.Peng,X.Jin,K.-C.Wong,M.Shi,andP.Li`o.Collectivehumanmobilitypatternfromtaxitripsinurbanarea[J].PloSone,2012,7(4):
481-487
[4]郭雪婷,秦艳丽,雷震.基于出租车GPS数据的城市道路拥堵判别[J].交通信息与安全,2013,31(5):
140-143
[5]蔡毅.基于出租车GPS数据的市交通小区的划分[J].科技创新导报,2013,(23):
218
[6]程志华.基于出租车GPS数据的道路交通运行分析———以乌鲁木齐市为例[J].科技论坛,2013,(35):
53-54
[7]N.AndrienkoandG.Andrienko.Visualanalyticsofmovement:
Anoverviewofmethods,toolsandprocedures[J].InformationVisualization,2013,12
(1):
3–24
[8]I.Boyandin,E.Bertini,P.Bak,andD.Lalanne.Flowstrates:
Anapproachforvisualexplorationoftemporalorigin-destinationdata[J].ComputerGraphicsForum,2011,30(3):
971–980,
[9]W.Zhang,S.Li,andG.Pan.Miningthesemanticsoforigin-destinationflowsusingtaxitraces[J].InProceedingsofUbiComp,ACM,2012.943–949.
[10]RosswogJ,GhoseK.Efficientlydetectingclustersofmobileobjectsinthepresenceofdensenoise[C].Procofthe2010ACMSymponAppliedComputing,NewYork:
ACM,2010:
1095-1102
2.主要研究容、目标、方案和进度及拟解决的关键问题:
主要研究容
第一部分:
数据采集
(1)原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向),车费,距离信息。
(2)对采集的原始数据过滤、抽样,入库。
第二部分:
出租车OD数据分析
(1)根据PGS数据结合市交通地图,计算分析不同区域上下客流量随时间的变化情况和发展趋势。
(2)研究交通枢纽地区的交通流。
选取特定区域出发和到达的客流量以形成对比分析。
(3)根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布,以计算某一时段地段出租车节点分布情况。
(4)在基本载座人员数量确定的假设条件下,对人们出行的OD时空分布进行数据推断和有效预测。
第三部分:
交通小区划分和道路拥堵分析
(1)根据车载数量和人们出行分布显示,应用特定k-means等聚类算法划分交通小区,匹配分析现有出租车投放机制。
(2)根据出租车载客后的行驶数据,设定拥堵的标准情况,筛选出拥堵的路段时段以及拥堵的路口时段。
第四部分:
OD系统可视化开发
(1)设计实现支持查询分析的出租车OD系统,以时间、地点和对象属性为查询条件,突出系统的数据渲染和筛选分布图。
(2)针对大数据容量的快速查询,计划采用基于一个轻量级数据库的实时交互访问可视化界面。
目标
项目计划建立一个基于出租车时空数据挖掘下的可视化分析系统模型。
结合交通地图,能够有效实现出租车OD数据分析,交通小区划分和道路拥堵分析,为城市交通规划和决策提供数据支持和参考分析。
方案
(1)数据采集:
由项目合作企业成员获得出租车PGS数据,依据数据抽样,设定数据区间,
本项目计划使用2013年7-11月之间的有效数据。
(2)OD数据分析:
设定交通枢纽要点为火车站和机场两个实例,对比分析交通流,按时段
统计不同区域上下客流量随时间的变化;运用SPSS中的聚类方法对交通小区时空分布情况进行有效划分;运用拥堵指标法、矩阵边界法等方式对拥堵情况进行有效识别和统计。
(3)OD信息系统开发:
基于C/S模式,采用轻量级数据库为后台,开发支持大数据交互式访问的系统访问。
采用支持时间、地点和对象属性为筛选条件下完全图形化可视化呈现。
进度
(1)2014年4月课题资料收集、数据采集、前期准备工作;
(2)2014年5月——2014年7月出租车OD数据分析、交通流量、枢纽数据分析;
(3)2014年8月——2014年12月出租车OD数据分析、车辆时空分布、人们出行时空预测分析;
(4)2015年1月——2015年9月交通小区划分,道路拥堵分析;
(5)2015年10月——2015年12月OD系统开发,完成数据有效集成分析
(6)2016年1月——2016年5月课题研究总结、研究报告、论文撰写;
拟解决的关键问题
项目拟解决的关键问题主要表现为以出租车PGS数据为依据,应用可视化的方式来呈现数据在的关联、分析、趋势和规律。
其目的是使用户能够交互地浏览数据和挖掘过程,还可以对训练后得到的结果模型进行直观的呈现。
项目计划基于一个轻量级的数据库之上,实现一个高效的显示策略。
能够有效开展车租车行驶轨迹下的时空数据分析和区域时空分布展示,以达到为地区交通规划和决策作为有效数据支持。
3.与本项目有关的工作条件(包括研究工作基础、实验条件等)
研究工作基础
一是出租车PGS数据,课题使用与相关企业合作研究的方式获取数据资料,目前共计有获取1000个出租车用户,30万条PGS信息。
考虑到相关数据样本的连续性问题,获取的数据不能覆盖完整的用户社会网络。
因此课题计划从中选取了600个车租车的轨迹数据进行实验。
二是数据挖掘和课时化工具。
主要使用的工具包括Gephi,netlogo,SPSS,java,sqlite等。
所有软件均已经到位。
相关科研条件
(1)我校是一所普通高等学校,现有六院两部共35个专业,全日制在校大学生1万多人,教职员工720余名。
学校已具备良好的科研环境,学校对项目大力支持,高效管理,确保本项目顺利完成。
(2)在经费方面,学院有完善的财务管理制度保障,学校出台了《关于各类科研项目经费管理的几条规定》,建立了项目立项经费配套制度及项目结题奖励制度,这为本项目的实施提供了强有力的制度与物质保障。
(3)项目负责人,多年从事信息计算和智能数据挖掘工作,课题研究经验丰富。
项目团队结构合理,各成员年龄结构、学历层次、学科背景组成对课题较为合理,呈现出较好的优势互补状态。
4.预期成果形式、去向和效益
成果形式
使用去向和效益
报告
1.分析市的出租车和人们出行时空分布,为交通决策和管理提供参考。
2.有效划分交通小区和拥堵状况分析,为出租车投放机制提供参考。
3.支持可视化技术对于数据的支撑,实现数据有效呈现
论文
提供一种基于可视化的车租车PGS数据挖掘操作,实现规模数据挖掘下的数据统计、聚类、预测,为有效研究时空数据可视化提供参考依据。
5.经费预算(单位:
万元):
合计
科研业务费
实验、材料费
仪器设备、图书资料费
相关经费
合计
2
0.5
0.4
0.7
0.4
2014年
0.9
0.2
0.4
0.2
0.1
2015年
0.8
0.2
0
0.4
0.2
2016年
0.3
0.1
0
0.1
0.1
购买主要设备、材料的名称、数量、金额:
数据分析软件(SPSS、Netlogo),数量为1,金额为0.4万元
6.学校审核意见:
年月日(盖章)