7.13 本章小结
内容小结:本章的内容除了沿袭第5章和第6章的思路外,新增了有关流量分析工具、流量采集分析系统的工作机制和流量数据与企业数据的整合等3个章节的内容介绍,原因是流量的数据采集和分析包括自主实施和使用第三方工具两部分,而更多时候主流的思路是直接使用第三方工具;而流量数据由于自身的特点,通常无法直接跟企业自身数据做完整集成,因此如何整合、整合哪些信息会成为整合的策划关键。本章的内容,希望能对传统的网站数据分析的思路和想法做更多拓展和应用。
另外,在企业在自主实施流量数据的跟踪、采集和分析时,往往不能取得良好效果,表现在工具本身的性能差,无法支持实时或准实时的查询,分析工具无法支持多维度的下钻和分析,工具无法提供多路径、归因等复杂模型的计算方法等。出现这种问题的根源在于流量数据工作是一个非常“费事”的工作,其需要耗费大量的人力、物力和服务器等软硬件资源,但在实施过程中需要专业的网站数据工作专家参与才能有较好的产品和数据产出,但这类的专家在中国还比较少;即使有专家一同参与完成这些工作,也由于流量数据工作无法产生较大的“显性”价值,而导致其价值认同度较低,因此也很难投入大量企业资源。
随着流量成本的提高,高质量的流量媒体越来越分散,相信以精细化运营为基础导向的流量运营工作,必然会增加对数据的依赖程度。与此同时,借助更多更深入的研究方法,流量数据分析也更能提升其自身对深入数据的挖掘和解读能力。这对于如何降低流量成本、增加流量规模、提高广告转化效果等方面具有重要意义。
重点知识:坦白讲,本章有关流量的知识包括7.2/7.3/7.4节都是非常重要的环节,这涉及数据的跟踪采集和生产机制,因此希望读者能够掌握。除此以外,流量数据化运营的分析指标、分析模型、小技巧以及最后两个案例也是重点知识,尤其是模型和案例中应用的思路和方法:
基于自动节点树的数据下探的思路。
KMeans最优K值的确定方法。
使用GraphViz自己画出树形图。
使用Matplotlib画雷达图。
外部参考:本章涉及的相关知识,需要读者通过外部资料做进一步学习和参考的内容如下:
在HTML中颜色的应用非常丰富,有关更多的颜色名称及其对应的十六进制代码,请参照http://www.w3school.com.cn/tags/html_ref_colornames.asp。
使用GraphViz做进一步的应用中,node是一个非常关键的对象。关于node节点还有更多可控的属性,除了本章介绍的内容外,请具体参考http://www.graphviz.org/content/node-shapes。
使用Matplotlib库不仅可以画出常见的图形,更包括很多异形图,例如桑基图、玫瑰图、热力图、等高线图、世界地理位置图、三维图等,有关这些图形的具体示例,除了本书之前的章节外,其他请参照http://matplotlib.org/gallery.html和http://matplotlib.org/examples/index.html。
虽然本书是有关流量数据化运营工作,但是对于流量的基础知识讲解甚少,有关流量的基础内容,读者可以通过《流量的秘密:Google Analytics网站分析与优化技巧(第3版)》了解更多,虽然这已经不是最新版本,但却是一个经典翻译本。
应用实践:网站数据分析与传统的数据分析和挖掘有其独立性,原因在于整个网站数据分析工作的各个过程大多通过网站分析工具“一条龙”完成。如果读者有兴趣,可以自己先通过免费的Google Analytics搭建一套网站流量分析系统,这里面会涉及很多数据采集、跟踪、预处理等规则问题,会加深对于流量数据工作各方面的认知。
流量数据工作的日常应用大多基于统计的,而对于流量数据的建模似乎很少用到算法、模型,本身提供的模型和案例思路,基本都使用了相关算法和模型,读者可应用到工作实践中。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论