返回介绍

14.2 分析方法与过程

发布于 2024-01-28 21:41:24 字数 1600 浏览 0 评论 0 收藏 0

手机用户在使用短信业务、通话业务、开关机、正常位置更新、周期位置更新和切入呼叫的时候均产生定位数据,定位数据记录手机用户所处基站的编号、时间和唯一标识用户的EMASI号等。历史定位数据描绘了用户的活动模式,一个基站覆盖的区域可等价于商圈,通过归纳经过基站覆盖范围的人口特征,识别出不同类别的基站范围,即可等同地识别出不同类别的商圈。衡量区域的人口特征可从人流量和人均停留时间的角度进行分析,所以在归纳基站特征时可针对这两个特点进行提取。

由图14-2可知,基于移动基站定位数据的商圈分析主要包括以下步骤。

1)从移动通信运营商提供的特定接口上解析、处理、并滤除用户属性后得到用户定位数据。

2)以单个用户为例,进行数据探索分析,研究在不同基站的停留时间,并进一步地进行预处理,包括数据规约和数据变换。

3)利用步骤2)形成的已完成数据预处理的建模数据,基于基站覆盖范围区域的人流特征进行商圈聚类,对各个商圈分群进行特征分析,选择合适的区域进行运营商的促销活动。

图14-2 基于基站定位数据的商圈分析流程

14.2.1 数据抽取

从移动通信运营商提供的特定接口上解析、处理、并滤除用户属性后得到位置数据,以2014-1-1为开始时间,2014-6-30为结束时间作为分析的观测窗口,抽取观测窗口内某市某区域的定位数据形成建模数据,部分数据见表14-1。

14.2.2 数据探索分析

为了便于观察数据,先提取EMASI号为“55555”的用户在2014年1月1日的定位数据,如表14-3所示,可以发现用户在2014年1月1日00:31:48处于36908基站的范围,下一个记录是用户在2014年1月1日00:53:46处于36902基站的范围,这表明了用户从00:31:48到00:53:46都是处于36908基站,共停留了21分58秒,并且在00:53:46进入了36902基站的范围。再下一条记录是用户在2014年1月1日01:26:11处于36902基站的范围,这可能是由于用户在进行通话或者其他产生定位数据记录的业务,此时的基站编号未发生改变,用户依旧处于36902基站的范围,若要计算用户在36902基站范围停留的时间,则需要继续判断下一条记录,可以发现用户在2014年1月1日02:13:46处于36907基站的范围,故用户从00:53:46到02:13:46都是处于36902基站,共停留了80分。停留示意图如图14-3所示。

表14-3 EMASI号为“55555”的用户在2014年1月1日的位置数据

图14-3 停留示意图

14.2.3 数据预处理

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文