文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
2.点击次数分析
统计分析原始数据用户浏览网页次数(以“真实IP”区分)的情况,其结果见表12-9,可以从表中发现浏览一次的用户占所有用户总量的58%左右,大部分用户浏览的次数在2~7次,用户浏览的平均次数是3次。
表12-9 用户点击次数统计表
详细代码见代码清单12-4。
代码清单12-4 Python访问数据库并进行分块统计(接代码清单12-3)
#统计点击次数 c = [i['realIP'].value_counts() for i in sql] #分块统计各个IP的出现次数 count3 = pd.concat(c).groupby(level = 0).sum() #合并统计结果,level=0表示按index分组 count3 = pd.DataFrame(count3) #Series转为DataFrame count3[1] = 1 #添加一列,全为1 count3.groupby(0).sum() #统计各个“不同的点击次数”分别出现的次数
从上表中可以看出大约80%的用户(不超过3次)只提供了大约30%的浏览量(几乎满足二八定律)。在数据中,点击次数最大值为42790次,对其进行分析,发现是律师的浏览信息(通过律师助手进行判断)。表12-10是对浏览次数达到7次以上的情况进行的分析,可以从中看出大部分用户浏览8到100次。
表12-10 浏览7以上的用户分析表
针对浏览次数为一次的用户进行分析,其结果如表12-11所示。其中,问题咨询页占比78%,知识页占比15%,而且这些记录基本上全是通过搜索引擎进入的。由此可以猜测两种可能:1)用户为流失用户,在问题咨询与知识页面上没有找到相关的需要。2)用户找到其需要的信息,因此直接退出。综合这些情况,可以将这些点击一次的用户行为定义为网页的跳出率。为了降低网页的跳出率,需要对这些网页进行针对用户的个性化推荐,帮助用户发现其感兴趣或者需要的网页。
表12-11 浏览一次的用户行为分析
针对点击一次的用户浏览的网页进行统计分析,其结果见表12-12。可以看出排名靠前的都是知识与咨询页面,因此可以猜测大量用户的关注都在知识或咨询方面上。
表12-12 点击一次用户浏览网页统计
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论