手机信令大数据在城市体检评估中的应用——以大连市为例

张翔

近年来,“以人民为中心的创作导向”、“以人民为中心的发展理念”等重要思想正式提出。2021年,自然资源部按照坚持以人民为中心的发展思想,发布《国土空间规划城市体检评估规程》(以下简称《规程》),确保国土空间规划城市体检评估的规范性和可操作性,有助于了解人民最关心最直接最现实的突出问题,提升人民群众的获得感、幸福感、安全感。《规程》倡导大数据等新技术和新方法的应用,对城市发展现状及规划实施效果进行分析和评价。鼓励利用大数据等先进技术,提高对空间治理问题的动态精准识别能力。对此,可联合电信运营商、互联网公司等大数据提供方,对城市建设、人口和就业特征、交通和通勤特征、公共服务设施配置、空间品质等开展分析评价[1]。

自然资源领域常用的大数据包括POI数据、手机信令数据、交通IC卡数据、位置服务数据等[2-3],本文重点讨论以手机信令数据为支撑的基本指标与推荐指标测算。

(一)手机信令数据类型分析

利用手机信令数据开展人口定量分析,弥补了传统统计数据的不足,提高了对人类活动的动态监测水平,具有良好的实用性与适用性。目前手机信令数据的分类:移动通信运营商可以提供两种手机信令数据服务方式。

第一种数据服务的数据处理结果是保留信令记录,对信令数据字段中的信令时间戳、信令事件类型代码、经度、纬度进行必要模糊处理。第二种数据服务的数据处理结果是按指定空间位置、指定时间段汇总用户人数,不保留加密移动用户识别码、不保留信令记录。城市体检评估相关大数据分析一般为人的群体趋势性分析,无需移动用户识别码等敏感信息。另外,考虑到分析的易用性,建议采用第二种数据服务开展分析工作。

(二)数据源详细说明

本次研究所用数据源为辽宁省范围内的联通手机信令数据,时间跨度为2019年9月1日至9月30日,共30天,记录时间精度为秒级,总记录量为TB级别。涉及全省30天共记录到1959万个用户,平均每天约1300万。共有16个表单,近200多个字段,包含了用户的实体行为以及虚拟空间的行为。

表1 手机信令原始数据包含的信息

图1 辽宁省2019年9月某日24小时人口实时分布

运营商基于原始数据通过剔除非人卡号、处理“乒乓效应”、处理“基站漂移”等一系列数据处理工作,得到不同类型的数据表单,用户可针对表单进行分析查询操作。常用表单情况如下:

(1)用户位置状态:用户一天的状态分为驻留和出行。原则上用户在同一位置停留超过 30 分钟形成驻留,部分情况可能出现驻留时间小于 30 分钟,用户每日的驻留记录在 stay_month 表,每一条记录为用户一次驻留行为,包含用户的驻留位置网格,驻留起止时间、编号、类型等信息 。

(2)月度驻留行为:stay_poi表为用户月度驻留行为的汇总,包含用户月度所有驻留位置的编号、位置网格、类型、分时段驻留时长、频次等信息 。

(3)驻留与驻留之间的出行行为:记录在 move_month 表中,包含用户每次出行的编号、起止位置网格、起止时间、类型、时间、距离等信息。

(4)用户出行轨迹:根据用户出行途径的基站点与路网进行空间拟合,得到用户出行轨迹的最可能路,根据用户出行途径的基站点与路网进行空间拟合,得到用户出行轨迹的最可能路网节点,记录到网节点,记录到move_rn(由于信令定位的精度限制,算法会优先与主干道路进行匹配),通过与route_node表进行关联,获取到路径经纬度信息,可以实现不同区域道路节点表的关联,获取到路径经纬度信息,可以实现不同区域或者道路上出行量的统计。

(5)用户属性信息:用户基础属性,通过uid、date、city字段与其余位置表进行关联,以实现不同区域不同时间段的画像特征统计。

(6)研究网格:s_city_grid,为方便数据统计和地图展示,预置了以城市边界范围绘制的标准250*250米网格,可以通过经纬度关联将用户位置网格进行替换,并在极智平台上进行制图展示;
客户也可以自行上传并同步不同大小形式的网格或者研究区域进行计算和展示。

数据源坐标系统:WGS84坐标系统。

利用手机信令数据,结合城市体检评估要求[1],充分挖掘有价值的潜在信息,提出城市对外日均人流联系量、工作日平均通勤时间、实际服务管理人口数量、45分钟通勤时间内居民占比、轨道交通站点800米半径服务覆盖率等5项基本指标与推荐指标测算方法。

(一)软硬件环境

通过智慧足迹DaaS平台提供的Spark & Hadoop混合大数据处理集群环境,对数据处理请求进行响应,再对应的数据存储及处理环境中进行数据建模及加工处理。借助SQL语言进行数据查询建模,注入查询条件,通过DaaS平台获取分析结果。利用Python编写爬虫程序,爬取相关的互联网地图POI信息资源。通过ArcGIS完成分析结果的处理与可视化展示。

(二)数据脱密和清洗

从加密移动用户识别码无法识别特定个人并无法复原对数据安全是至关重要的,在一般情况下只许输出聚合统计后的指标结果。同一个移动用户识别码在不同区域加密后得到的加密移动用户识别码相同。由于手机信号等不稳定因素,导致有些数据可能存在异常,比如信号丢失或信号位置偏移严重等,需识别并清理该部分异常数据,确保分析结果的准确性[4-6]。

(三)数据的可视化

基于联通手机信令的大数据技术,以250m*250m正方形网格为最小单位,提取大连市域常住人口、OD通勤以及职住关系等特征信息,赋予每个网格分析结果信息,结合GIS工具,形成实时精确的数据可视化解决方案,满足各类数据分析应用场景。

GIS空间数据均采用WGS84坐标系,如果其他原始数据不属于,可采用坐标系变换的方式,或利用基础影像图、控制点等数据对其进行校正。

(四)数据挖掘方法

通过手机信令数据融合提取每个用户连续一个月的出行轨迹,进行匿名化处理,完成排除异常、消除乒乓效应等数据清洗工作后,采用聚类分析的方法进行轨迹频繁模式挖掘[7],DaaS平台在聚类分析的数据基础上提供多类表单。下一步重点分析表单结构,筛选对其有用的表名与字段,基于提供的基础内容构建人群特征分析、OD分析等核心算法,结合五种指标的描述,根据数据源挖掘其潜在价值,建立分析模型,分析得出相对应的指标信息,并可利用ArcGIS或QGIS等工具完成可视化操作。

图2 数据挖掘的技术路线

(一)城市对外日均人流联系量

单位:万人次;

分析过程:

识别每个ID的停留O点和D点,大于1小时停留算有效停留。当天该ID的出发地O点在城市A,目的地D点在城市A外,此类情况就算该天的一次对外人流,D点发生时间不做设定。汇总得出每日的城市对外人流联系量,30天累加平均后获得。计算结果为30.53万人(未扩样)。

图3 辽宁省省域范围内各街道对外OD分析

(二)工作日平均通勤时间

单位:分钟;

分析过程:

从数据集的Move_month表单中提取城区工作日内,家到工作地移动的总人数作为总的通勤人口,计算该部分人口的总的家到工作的时间为工作日总通勤时间,并与工作日总通勤人口数量的比值计算获得。结果为30.53分钟。

图4 大连市平均通勤时间分析

(三)实际服务管理人口数量

单位:万人;

分析过程:

利用联通手机信令数据识别大连市域内9月每天的停留人口(stay_day表单),定义实际服务人口:常住人口+短期驻留人口+其他人口。其中短期驻留人口:一个月内出现大于1天且小于10天(每天停留时长3小时以上);
其他人口:一个月内出现大于10天且小于18天(每天停留时长3小时以上);
常住人口:一个月内出现大于18天(每天停留时长3小时以上);
三类人口加和后进行扩样[8]。结果为1050.2万人(未扩样结果251.6万人,扩样系数0.239679875)。

图5 实际服务人口分布情况

(四)45分钟通勤时间内居民占比

单位:%;

分析过程:

从数据集的Move_month表单中提取城区内从家到工作地移动的总人数作为总的通勤人口,计算其在家到工作地的时间,通过筛选通勤时长在45分钟以内通勤人口,并与总通勤人口数量的比值计算获得。结果为占总通勤人口的93.30% 。

(五)轨道交通站点800米半径服务覆盖率

单位:%;

分析过程:

以获取的轨道交通站点点位,做800米的点缓冲。识别该范围内的居住人口,以及就业岗位数(居住人口,就业岗位可从数据集中直接提取),两者的比值即为人口和岗位覆盖率。计算结果,800米内人口/总人口=0.21;
800米内岗位/总岗位=0.32;
(800米内人口+岗位)/(总人口+总岗位)=0.24。所以最后结果为24%。

图6 研究范围内工作人口居住/工作地与轨道交通站点的关系

本文探讨了如何利用手机信令数据,挖掘有价值的潜在信息,并以大连市为例深入实践,为国土空间规划城市体检评估相关指标测算提供了新技术、新方法。并分析了目前主流手机信令数据的两种类型,从分析的易用性角度给出选择建议。基于连续一个月的联通手机信令数据,构建了技术路线,重点开展了城市对外日均人流联系量、工作日平均通勤时间、实际服务管理人口数量、45分钟通勤时间内居民占比、轨道交通站点800米半径服务覆盖率等5项基本指标与推荐指标测算。但由于目前手机信令数据源较为单一,缺少其他两个运营商数据,在人群覆盖度、扩样系数方面存在误差。因此,应探索三大运营商数据结合的方法,提升数据准确性,充分发挥手机信令数据在国土空间规划城市体检评估中的作用,提高对空间治理问题的动态精准识别能力,为新一轮国土空间规划提供技术支撑。

猜你喜欢 表单信令人口 《世界人口日》青春期健康(2022年13期)2022-07-18人口转型为何在加速 精读英语文摘(2022年4期)2022-06-05电子表单系统应用分析华东科技(2021年9期)2021-09-23SLS字段在七号信令中的运用铁路通信信号工程技术(2019年10期)2019-11-06基于图表示和匹配的表单定位与提取智能系统学报(2019年2期)2019-04-10移动信令在交通大数据分析中的应用探索中国交通信息化(2019年2期)2019-03-25人口最少的国家小天使·一年级语数英综合(2018年3期)2018-06-221723 万人,我国人口数据下滑引关注领导决策信息(2018年10期)2018-05-22浅谈网页制作中表单的教学现代职业教育·职业培训(2018年1期)2018-05-14基于信令分析的TD-LTE无线网络应用研究消费导刊(2017年24期)2018-01-31

推荐访问:大连市 为例 体检