14.2 分析方法与过程
手机用户在使用短信业务、通话业务、开关机、正常位置更新、周期位置更新和切入呼叫的时候均产生定位数据,定位数据记录手机用户所处基站的编号、时间和唯一标识用户的EMASI号等。历史定位数据描绘了用户的活动模式,一个基站覆盖的区域可等价于商圈,通过归纳经过基站覆盖范围的人口特征,识别出不同类别的基站范围,即可等同地识别出不同类别的商圈。衡量区域的人口特征可从人流量和人均停留时间的角度进行分析,所以在归纳基站特征时可针对这两个特点进行提取。
由图14-2可知,基于移动基站定位数据的商圈分析主要包括以下步骤。
1)从移动通信运营商提供的特定接口上解析、处理、并滤除用户属性后得到用户定位数据。
2)以单个用户为例,进行数据探索分析,研究在不同基站的停留时间,并进一步地进行预处理,包括数据规约和数据变换。
3)利用步骤2)形成的已完成数据预处理的建模数据,基于基站覆盖范围区域的人流特征进行商圈聚类,对各个商圈分群进行特征分析,选择合适的区域进行运营商的促销活动。
图14-2 基于基站定位数据的商圈分析流程
14.2.1 数据抽取
从移动通信运营商提供的特定接口上解析、处理、并滤除用户属性后得到位置数据,以2014-1-1为开始时间,2014-6-30为结束时间作为分析的观测窗口,抽取观测窗口内某市某区域的定位数据形成建模数据,部分数据见表14-1。
14.2.2 数据探索分析
为了便于观察数据,先提取EMASI号为“55555”的用户在2014年1月1日的定位数据,如表14-3所示,可以发现用户在2014年1月1日00:31:48处于36908基站的范围,下一个记录是用户在2014年1月1日00:53:46处于36902基站的范围,这表明了用户从00:31:48到00:53:46都是处于36908基站,共停留了21分58秒,并且在00:53:46进入了36902基站的范围。再下一条记录是用户在2014年1月1日01:26:11处于36902基站的范围,这可能是由于用户在进行通话或者其他产生定位数据记录的业务,此时的基站编号未发生改变,用户依旧处于36902基站的范围,若要计算用户在36902基站范围停留的时间,则需要继续判断下一条记录,可以发现用户在2014年1月1日02:13:46处于36907基站的范围,故用户从00:53:46到02:13:46都是处于36902基站,共停留了80分。停留示意图如图14-3所示。
表14-3 EMASI号为“55555”的用户在2014年1月1日的位置数据
图14-3 停留示意图
14.2.3 数据预处理
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论