9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx

上传人:b****2 文档编号:14537591 上传时间:2022-10-23 格式:DOCX 页数:11 大小:1.77MB
下载 相关 举报
9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx_第1页
第1页 / 共11页
9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx_第2页
第2页 / 共11页
9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx_第3页
第3页 / 共11页
9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx_第4页
第4页 / 共11页
9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx

《9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx(11页珍藏版)》请在冰豆网上搜索。

9 基于城市微博签到数据的人群活动时空特征分析Word文档下载推荐.docx

社交媒体极大地影响了人类社会的方方面面,人们通过社交网络发布照片或者签到状态,这些带有地理标签和时间戳的轨迹数据以其独特的社会和空间特性为争辩人类出行活动供应依据。

Lee等争辩日本Twitter中用户活动位置随时间的变化,并应用于城市区域争辩中;

王波等基于微博用户人群的关注关系及签到数据分析了人群在南京市区的空间活动特征、网络信息空间的地理特征及城市区划争辩;

周艳等基于社交媒体中的签到数据提出不同于传统社会以经济为依据的城市人群分类方法;

张德朋等通过微博争辩杭州市居民的出行状况进而发觉城市的时空变化规律;

王艳东等利用社交媒体来探寻突发大事的时间趋势与空间分布,为应急响应供应支撑;

雷程程通过将用户的时空分布特征与区域内的用地类型相结合,分析挖掘人群活动特征与用地类型之间的关系;

隨正伟等利用签到数据来度量用户的空间相像性。

国内的多数争辩区域选在人口密集的大中型城市,尺度较大,且争辩对象即微博用户以常驻人口居多,以及争辩重点更倾向于空间位置分布。

本文选取流淌性较大、以旅游者为主的典型旅游城市大理市为争辩区,结合争辩区特点均衡分析人群活动在时间变化和空间分布的规律特征,并将时间与空间属性结合用于分析人群活动的时空特征及热点大事检测。

一、争辩区与数据预处理

1.1争辩区

争辩区位于云南省大理白族自治州大理市,城市旅游资源分布密集,旅游基础设施完备,境内苍山、洱海属于国家级风景名胜区和自然疼惜区,具有崇圣寺三塔国家5A级景区、大理古城、蝴蝶泉4A级景区、双廊特色小镇、喜洲古镇等大小对外接待景点100多个,属于多功能的历史文化旅游区,是中国西南边疆开发较早的地区之一,也是滇西北的重要旅游区和云南省旅游发达地区之一。

大理市常住人口约62万人,近些年来,随着大理市旅游业的进展,旅游人数及收入呈渐渐上升趋势。

据大理市人民政府数据统计,2018年全年接待海内外游客共1845.28万人次,同比增长10.21%,旅游社会总收入为356.35亿元,同比增长18.66%。

全市旅行社79个,从业人员达1708人,星级饭店客房总数为3232间。

大理市在旅游资源的数量和空间分布密度、人口、经济进展等方面都位居云南省首位且具有明显优势。

作为国际旅游城市,其旅游人口较多,信息化程度以及网民普及率也相对较高,具有否定的争辩意义。

1.2数据预处理

本文以新浪微博签到数据作为争辩对象,基于新浪微博API接口猎取2019年1月1日至2019年6月30日半年内的签到数据。

数据集包含用户名、用户ID、用户地址、签到地点、日期、时间、经纬度等数据项。

首先,将采集的数据依据经纬度导入ArcGIS10.2中与大理市行政范围边界叠置,将争辩区范围以外的签到数据剔除;

其次,将具有相同ID、相同时间、相同签到位置的重复数据进行删除,最终猎取13625条数据;

最终,由于大理市位于西南地区,日落和日出相对较晚,因而人群活动时间会向后偏移。

依据居民大体日常活动作息时间,分别将每个月的时间划分为0∶00~4∶00、4∶00~8∶00、8∶00~12∶00、12∶00~16∶00、16∶00~20∶00、20∶00~24∶00这6个时间段,在此基础上进一步分析人群活动的空间变化规律。

 

二、城市人群时空特征分析

2.1人群活动时间特征分析

依据时间段的划分,分析大理市活动人群总体、工作日和休息日(包括双休日及节假日)随时间变化的活动规律。

依据整体统计结果来看,大理市2019年1~6月人群活动每个月都存在着明显的活动规律变化,如图1所示,从而发觉传统的人群作息规律照旧主导着签到活动。

图1每月不同时间段人群签到数量图 

具体来看,越来越多的人由于各种缘由选择熬夜晚睡,在0∶00~4∶00的时间段内多数人才渐渐入睡休息,签到数量渐渐削减;

在4∶00~8∶00正处于熟睡阶段,从而签到数量降至最低;

8∶00~20∶00为大部分人的上下班及工作时间,签到规模增加且处于相对稳定的状态;

20∶00之后为人群的自由活动时间,在进行了一天的工作和学习之后,人群的休闲消遣活动增加,在此时间段内签到数量突然上升;

24∶00之后渐渐进入休息睡眠阶段,导致签到数量明显降低。

由于大理地处低纬高原,具有独特的高原地方性宜人气候,四季以及早晚的温差不大,不会因气候问题过多限制早间与晚间人群出行活动;

且近些年来,通过网络媒体及众多影视歌曲对大理的宣扬,慢节奏安逸奇怪的生活吸引着更多游客,而多数游客来到大理都会选择体验夜间古镇酒吧的氛围达到放松的目的,从而影响着夜间活动时间正渐渐呈上升趋势。

将每个月划分工作日与休息日进行签到数量统计,如图2所示,发觉人群签到时间分布规律既在整体上具有相像性,又具有否定的差异性。

从整体分布来看,0∶00~1∶00签到数量处于相对高的水平,随后渐渐开头下降,进入睡眠阶段;

3∶00~7∶00为低峰期,签到数量最少,说明此时绝大多数人已处于熟睡阶段;

7∶00~19∶00签到数量有波动状况,但总体趋于平稳状态,此时处于一天中工作学习时间,所在地点相对稳定,导致签到数量没有太大起伏;

19∶00之后签到数量持续上升,说明人群的休闲消遣活动主要集中在此时间段。

相比工作日和休息日,由于工作日有上下班高峰期时间,在8∶00~10∶00以及18∶00~20∶00之间签到数量会有所上升,休息日分布在8∶00~20∶00内的签到数据则相对平稳,没有太大起伏;

而且由于休息日的时间相对宽松,在时间轴上人群活动节奏相比工作日会往后有所偏移。

图2每小时人群签到数量图 

2.2人群活动空间特征分析

图3为人群签到位置数据分布图,为更好地对人群空间分布进行分析,将整个争辩区域进行格网化并与签到数据点进行空间连接后接受核密度分析法及热点分析法对人群空间分布进行争辩分析。

图3人群签到数据分布图

接受Kernel核密度分析法来计算人群签到地点在其四周邻域中的密度,如图4所示,发觉人群分布第一显著的高密度点位于大理市的西南方向,其次高密度点位于南面,其他稍高密度点分布较为均匀且紧邻洱海周边。

图4人群签到数据核密度分析结果图

为进一步发觉人群活动的位置分布状况,对包含签到数据点的格网内的人群签到数量进行热点分析(Getis-OrdGi*)。

通过计算得到的z得分及p值,猎取发生空间聚类的位置。

Gi*即为z得分,Getis-Ord的局部统计表达式为:

式中,xj是格网j中的签到数量,w 

i,j是网格i与 

j之间签到数量的空间权重,n为总网格数,其中,

依据如图5所示的热点分析结果可以发觉,位于洱海西部的第一显著高密度点及南部的其次显著高密度点内的聚类最为紧密,颜色呈深红色。

其中位于洱海西部区域旅游景点较集中,包括大理古城、崇圣寺三塔、感通寺、天龙八部城等,而且很多精品客栈也分布在四周,大部分旅游者都会选择在此四周居住并在景区留下签到记录作为纪念。

旅游汽车客运站也分布于此,由于云南省地形错综简洁地势险要,铁路修建困难,因此省内汽车出行会因其便利性做为首选出行方案,而其中旅游人群相对较集中,相对存在更多签到数据。

另外,大理高校也位于这片区域,年轻同学作为媒体社交签到人群中的主要群体,签到记录较为活跃。

位于洱海南部的高密度签到区主要是行政区及居民区,包括大理市第一人民医院、大理国际奥林匹克体育中心、下关镇人民政府、汽车客运北站及大理站、洱海公园等。

通过与第一高密度区域的用户地址对比分析,发觉在此区域的活动人群旅客数量相对削减而本地常住人口相对增多。

洱海东南部也存在一个稍高密度点,此区域主要包括滇西应用技术高校、大理技师学院,也是同学群体比较多的区域;

大理机场也分布在此区域内,流淌人口多为旅游者,签到频率相对较高。

其他区域如位于东北部的双廊、西北部的喜洲白族村落也因特色景点及民族风情吸引着部分人群观赏游玩,但因地域分布相对于热门景区较为分散,因而签到数据数量并不突出。

图5人群签到数据热点分析结果图

2.3用户行为时空特征分析

为探究人群活动空间分布受时间关系的影响,本文将工作日与休息日的签到数据进行比对分析。

接受空间自相关分别对两个数据进行探究性空间分析,本文接受ArcGIS10.2中的GlobalMoran'

sI方法对签到数据点进行全局空间自相关分析。

依据莫兰指数值、Z得分及p值对其相关性进行评估。

其中,空间自相关的Moran'

sI统计可表示为:

式中,Wi,j为位置i与j间的空间权重,Zi为位置i中的微博签到数量xi与平均值X-之间的偏差,Zj为位置j中的微博签到数量xj与平均值X-之间的偏差,n为总签到格网数,S0为全部空间权重的集合,其表达式为:

统计ZI得分的表达式如下:

式中,期盼值E[I]=-1/(n-1),方差。

依据表1的结果,Moran'

sI>0,Z得分均为正,p=0满足在置信度99%下p值小于0.01的要求,说明工作日和休息日均以典型聚类模式进行空间分布,即用户活动密集区域与用户签到活动密集区域相邻近,用户活动离散区域与用户活动离散区域相邻近。

表1工作日与休息日空间自相关分析表

为反映用户时空行为特征规律,分别对工作日与休息日人群活动空间分布进行点密度分析并对得出的结果做差值分析。

经分析比对可发觉图6a的工作日和图6b的休息日人群活动高密度区域没有太大差异,均集中在洱海西部旅游景点集中区和南部行政区、居民区,但从整体分布密度来看又存在否定差异。

如图6c所示,除颜色较深区域分布密度相近外,工作日签到数据分布较为分散且分布在四周八方,而休息日则相对集中分布在各个密集点四周,说明工作日人群多数分散在不同的工作地点,而休息日时外来游客较多,大部分聚集在旅游景点集中区,正由于人群集中于此区域,相比之下周边地区过于冷清。

图6点密度分析结果图

结合图1每月不同人群签到数量图会发觉,受大理市的环境气候及人文风情影响,3月的人群活动较为频繁。

白族人的节日盛会都集中在3~4月:

如三月街,也称三月街民族街,是大理白族盛大的节日和街期,于农历三月十五日至二十一日在大理古城以西三月街举办;

如花朝节,古城及郊区的居民于农历二月十四在大理古城各条街道逛花街赏花景;

并且此时正值春季可观赏樱花,每年3月5日之后的10天左右为大理高校最好的赏花季节;

而此时段人群活动均在大理古城、大理高校及洱海四周,符合典型旅游城市无论工作日还是休息日的人群高密度活动区均集中于景区四周。

三、热点大事检测

基于人群时空行为特征规律,进一步可以从时间及空间维度上检测热点大事的发生。

本文将每日签到数据进行对比分析,如图7所示,发觉具有明显突出数量的日期包括3月1~4日、15日,4月5日、19日,5月1~4日、19日,6月7~9日及中下旬,为探讨从时间、空间维度发觉热点大事,排解4月5日清明节、“五一”劳动节、6月7日端

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 互联网

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1