返回介绍

7.10 流量数据化运营分析的 大实话

发布于 2024-01-27 22:54:28 字数 7868 浏览 0 评论 0 收藏 0

本节的大实话,将来探讨一些常见的流量工作的深层规律。

7.10.1 流量数据分析的价值其实没那么大

虽然流量是所有后续工作的先锋,看似拥有很高的企业价值,但作为网站数据分析从业者,是否问过自己这样一个问题:网站数据分析的价值真的那么大吗?假如公司没有网站数据分析,各项业务运作体系是否会受到影响?——如果你的回答是不肯定甚至是确定没有影响,那足以证明在整个公司流程中网站数据分析工作没有多少价值。

对于不同类型的公司,网站数据分析工作的价值大小有所差异。

在线营销类或服务类广告公司的业务核心是通过为广告主提供广告投放、评估和优化业务,进而获得费用差价、佣金返点、服务费等,由此形成公司核心利润业务。网站数据分析所处的角色是对这些业务体系提供数据评估和优化,此时由于从业者的工作与公司核心业务结合紧密,因此其职业价值会比较高。

线下苏宁、国美的大卖场为集团销售类业务贡献90%以上的利润,而线上的电商业务体系分割了不到10%甚至需要利润补贴进行运作,此时针对线上业务的网站分析体系的价值在整个苏宁和国美集团中显得微不足道。由于从业者的工作与公司核心业务距离较远,因此其职业价值会比较低。

上述两个例子阐述了网站数据分析在不同公司的不同存在意义,从本质上讲网站数据分析价值的外部环境取决于公司的基础基因,即公司的核心业务模式是否与网站分析相关以及相关性的强弱。

7.10.2 如何将流量的实时分析价值最大化

在做流量数据工作时都期望自己的工作内容能在实际运营中发挥重要作用。其中流量的实时分析是流量工作的重要内容之一,但针对流量的实时分析并不能在所有场景中都发挥作用,而是有特定的作用范围和要求:

可监测的业务效果。实时分析发挥作用的前提之一是有数据支持,这要求数据既要可控于企业内部又要可测量。例如,企业在电视媒体上投放的广告由于不可测量而无法提供实时数据支持;企业在视频网站上投放品牌类广告,如果没有可供监测的播放时长、播放率等数据,也无法提供实时数据支持。

可实时反馈的数据。实时分析的第二个关键点是数据可以实时更新,实时数据支持的基础频率是分钟和秒,在某些场景下采用按小时或天更新的频率无法满足实时分析需求。

可优化的业务节点。可优化是实时分析的输出关键,这意味着产生实时分析结果后,业务方可针对性的改善和优化;如果实时监测的业务无法进行优化操作,那么实时分析的价值将大打折扣。

实时分析并不能针对所有渠道都发挥作用,某些渠道的固定性质决定了其不存在实时分析的落地价值。

(1)固定投放类渠道

固定投放类渠道包括包段投放的广告(例如包月、包天)、固定购买的网址导航(例如360导航的文字链)、商务合作的友情链接、SEM品牌区等。这些渠道的特点是购买或合作的媒介类型已经固定、无论是投放时间、投放内容还是投放频率,其可操作性较差。例如针对网址导航的媒介购买,通常是季度投放,即使通过实时数据发现一天中某个时间点存在可优化价值,由于其推广形式(通常是网站文字名称)和合作周期(固定一个季度)限制,实时分析无法落地。

(2)资源紧俏类渠道

虽然当前可供选择的广告媒介数量众多,但流量高、效果好、效果持续的媒介仍然是少数,如网址导航广告、百度关键字、门户首页和特定频道页、客户端弹窗等。在这种背景下,业务团队执行的第一要素仍然是抢夺投放资源和排期,因此即使出现可供实时支持的辅助决策,也会由于缺乏优化资源支持而无法实施。这类资源以流量巨大的门户、富媒体资源为主。

7.10.3 营销流量的质量评估是难点工作

针对营销部门的效果评估是流量工作的重点内容之一。流量效果评估可通过“7.4流量数据化运营指标”中的指标实现,其中涉及的流量质量的评估不仅是重点还是难点工作,主要表现在两方面:

一方面,“质量”并不是一个恒定且可以用数据直接定义的指标,不同目标、不用需求、不同时间下质量定义不同。

另一方面,“质量”结果的影响因素多种多样,很难准确区隔不同因素对“质量”的影响权重。例如,针对跳出率高的分析点至少包括三方面:

站外渠道因素,即渠道本身的质量因素,包括群体喜好、需求、媒体质量等;

站外广告因素,即广告素材对质量的影响,包括广告卖点、宣传商品、促销价格等;

站内自身因素,包括着陆页设计、用户对网站品牌的认知度、熟悉程度等。

以上三方面因素综合影响跳出率,但很难只将站内渠道因素分离处理并得到渠道本身质量问题;尤其是关于信息匹配度、需求吻合度、价格敏感度、需求强烈度、品牌认可度等主观数据无法直接通过数据测量。这也是当前流量运营中的难点,因此大多数情况下流量效果评估仍然聚焦在流量规模上,而对于流量质量的评估上属于“辅助”评估因素。

作为数据从业者,仍然可以一定方法来对营销流量做评估和校验:

对比分析是评估广告流量质量的实用方法,将广告流量与非广告流量进行对比即可了解到底是渠道质量问题还是网站自身质量问题。

建立复合指标评估体系,将用户的复杂行为分解为可供站内评估的目标矩阵,如注册、试用、订单、产品页浏览、加入购物车等。

A/B测试(双变量测试)是找到最佳方案的有效手段,可直接对比发现影响渠道质量的关键因素。

7.10.4 个性化的媒体投放仍然面临很多问题

个性化的媒体广告投放相对于大众广告投放具有以下3方面优势:

1)更好的用户体验。传统广告的单向传播模式在个性化媒体时代发生了变化,用户的每一个“声音”都被记录和分析;同时,媒体已经开始“猜测”用户需求,媒体的角色开始从主观推送需求向满足需求转变,整个过程的用户认知度、体验度和忠诚度提高。

2)营销效率的提升。传统广告的购买与投放执行主要依靠广告代理或企业自身,经过谈判之后购买固定时间、版面、人群、网站群等;由于整个过程主要靠人工操作,效率低且出错几率大,更重要的是要耗费大量人力、财力、物力和时间成本。个性化媒体投放通过自动化、智能化程序实现人群定位、素材管理与投放、效果评估与自我优化等关键流程,大大提高了营销效率。

3)营销效果的提升。个性化媒体投放从广告曝光、点击、到达这三个关键环节都是针对用户个性化需求而提供的内容,高度相关的内容提高了广告点击率、到达率,直接从广告源头提高流量,直接降低CPM、每次点击成本和每次访问成本的同时还能促进广告转化率的提升。

个性化媒体投放针对用户投放个性化内容,在广告整个生命周期内的各个环节效果指标都会有所提升,包括更好的点击率和点击次数、更好的二跳率和访问深度、更高的转化率与转化贡献价值等。

但是在真正应用过程中仍然面临很多问题:

(1)媒体认知问题

从大众传播开始媒体就一直处于强势地位,广告、消息等都是直接通过媒体向用户单向传播;媒体对于自身定位、服务价值、服务方式等定位仍然停留在强势媒体阶段,大多数媒体尤其是强势媒体还没有“客户服务”的概念,个性化媒体广告投放无从谈起。这直接导致了接入到个性化媒体平台的媒体数量,尤其是优质媒体数量的不足。

(2)优势资源问题

虽然现在可供选择的媒体平台众多,但真正的高价值流量仍然集中于少数媒体,这些媒体往往通过CPD(包段购买,如包天、包月)、CPM(每千次付费)等品牌传播类形式售卖优势资源,如新浪门户的首页焦点图、视频媒体TIPS弹窗等、导航文字链都属于此类售卖方式;而能够实现个性化媒体投放的资源往往是优势资源之外的“剩余资源”或低价值资源位,因此造成个性化媒体投放难以大规模应用到核心媒体资源或核心媒介中。覆盖面的不足直接导致了曝光的补足,个性化媒体从入口开始面临紧缩考验。

(3)技术实现问题

个性化投放的实现需要基于海量数据,但这些数据以及对应的实施技术和规则等仍然面临现实性难题:

数据不全面。个性化媒体投放需要尽量多的关于平台、用户和投放企业的信息,而这些信息是分散在不同场景中的,媒体本身无法掌握全部信息。数据不全直接导致个性化投放效果不佳。例如我在A商城浏览了P商品,但之后2天我却在B商城购买该商品,此时A商城的个性化广告很可能会持续给我推送P商品的广告和促销活动。

方案无法全部个性化。个性化的媒体广告投放,如果是涉及商品投放的可以直接调取商品属性和描述信息,但如果是文字、图片、视频以及交互类广告的则需要企业主提供多种交互方案,这本身就不是一个可以完全个性化的实施思路,因为广告主无法想到所有的个性化广告方案。

7.10.5 传统的网站分析方法到底缺少了什么

趋势、细分和转化是传统网站数据分析的三大方法,但这种方法随着数据工作的深入会发现其价值越来越不显著。这些分析方法到底缺少了什么?

这三种分析方法配合漏斗分析、路径分析、归因分析等可以为企业建立良好的整体性、流程性及趋势性结果,但是归根到底这都是针对群体或整体性的分析,而缺少针对个体性质以及个体间相互关系的分析。

当前市场上的大型第三方网站分析解决方案似乎也意识到了这一点,因此在保持传统网站分析方法的同时又增加了可以深入挖掘数据价值和规律的“数据挖掘”或“机器学习”方法。

(1)关联分析模型

我们在很多场景下都介绍过关联分析的应用,在网站分析工具中,关联分析模型的应用代表是Webtrekk。Webtrekk将关联模型封装到产品底层,其是基于Top-K关联规则产生(Top-K Association Rules)。这一算法是在传统基于最小支持度和置信度的前期下做的优化,它具有优异的性能以及可扩展性,尤其当用户想要控制输出规则的数量时非常有效。

该模型可以应用到页面关联分析、站内外搜索词关联分析、产品浏览关联分析、产品购买交叉分析、渠道访问交叉分析。在使用该报表和数据之前,需要先在Webtrekk中配置关联模型相关维度和参数,如图7-12所示。

Webtrekk的关联分析应用具有以下特点:

图7-12 Webtrekk关联模型配置

关联分析的算法支持交叉销售算法和向上销售算法两种;

数据集都是基于Raw Data(原始在线采集数据);

数据计算时间可设置为每天、每小时或一次;

挖掘维度支持页面、渠道、产品、广告、站内外搜索词的浏览和购买关联;

支持数据挖掘的高级配置。支持最小频繁度,分析类别选择追加销售序列分析时还可设置追加的数据集时间,支持基于细分群体的关联,如只看某个页面的关联效果,只需要过滤该页面即可。

Webtrekk的关联模型应用范围广泛,它可以提供以下数据价值洞察:

用户搜索了站内A关键词之后通常会优化搜索哪个关键词?

用户在看了A页面之后,通常还会看哪个页面?

用户买了A产品之后,还会一起买哪个产品?下次又会买哪个产品?

用户从A渠道进入网站之后,通常还会从哪个渠道再次进入?

在所有的数据挖掘类算法中,规则提取类是最受业务应用关注的算法,原因是提取后的规则可直接帮助业务开展业务活动,实用价值最高(规则提取类算法包括关联、回归、决策树等以直接目标为分析导向,提取能实现目标规则的算法,如购买A的用户下一次通常会购买B)。

(2)RFM和RFE模型

我们在5.4.3节和5.4.2节分别提到过RFM和RFE两个模型。网站分析工具Webtrekk提供了这两种分析模型。

该模型在系统后台的配置如图7-13所示。

图7-13 Webtrekk RFM和RFE配置功能

这两种模型具有如下特点:

每天运行一次模型,不同时间内得到的RFM和RFE得分有差异。

基于阈值定义而非百分位(例如3分位)的区间划分。

支持自定义阈值来控制三个区间的范围边界。

(3)异常检测模型

Adobe Analytics提供了另外一种预测性检测方法——异常检测模型。Adobe Analytics使用的是时间序列的预测方法,由三种算法组成:

Holt Winters Multiplicative(Triple Exponential Smoothing)——霍尔特温特斯乘法(三重指数平滑法)。

Holt Winters Additive(Triple Exponential Smoothing)——霍尔特温特斯加法(三重指数平滑法)。

Holts Trend Corrected(Double Exponential Smoothing)——Holts趋势校正(双指数平滑法)。

这三种算法实际上共同组成了温特斯季节指数平滑模型,其基本思想是把具体线性趋势、季节变动和随机变动的时间序列进行分解研究,并与指数平滑法相结合,分别对长期趋势(Ut)、趋势的增量(Bt)和季节变动(Ft)作出估计,与指数平滑法结合起来,可以同时处理趋势和季节性变化,并能将随机波动的影响适当地过滤掉,然后建立预测模型,因此,特别适用于包含趋势和季节变化的时间序列的预测问题。

该模型配置比较简单,所有算法都已经封装到系统内部,用户只需要进入后台设置训练数据集、数据时间、数据维度即可:

数据训练集时间:数据训练集,即要进行计算和处理的样本数据的时间范围,(默认截止到昨天)数据训练集的时间可选项为30天、60天、90天。

数据查看集时间:与数据训练集时间选项相同,不同点在于数据直接用来验证训练集的结果。

数据指标和维度:异常检测可以针对全站所有的维度和指标进行预测。默认情况下,系统后台是针对全站的异常检测配置,针对自定义维度设置预警需要额外配置。图7-14展示的是针对BD模块UV预警。

图7-14 针对BD模块UV预警设置

这种异常检测模型可以应用到以下场景:

监测网站平均订单价值、订单量、订单转化率波动;

注册或登录的异常变化;

某个登录页面浏览量趋势;

正在投入巨额广告费的渠道效果波动;

网站跳出率情况是否正常波动。

除了上述算法外,Adobe的Data workbench也提供了部分数据统计分析和挖掘模型。Data workbench是Adobe Analytics中数据挖掘能力最强的产品,它侧重于跨渠道(线上线下)数据整合分析。在Data workbench集成了聚类模型、关联矩阵和评分模型三种算法,提供了更多统计学数据解读视角。

(4)聚类模型

通过访客聚类,可以利用客户特性对访客进行动态分类,并基于选定的数据输入生成聚类集,从而识别具有相似兴趣和行为的群组,以便进行客户分析和定位。Data workbench的聚类使用的是K-Means算法,聚类分析结构如图7-15所示。

(5)关联矩阵

关联矩阵实际上不属于数据挖掘算法,它是一种统计学方法,用来分析不同变量间相关性关系。Data Workbench中的统计关联基于皮尔逊关联模型,该模型的本质是验证变量间的线性依赖关系,关系强弱用R值表示。有关相关性分析的更多话题,请参见3.8节的内容。

(6)评分模型

通过倾向评分,针对每个访客计算的评分表示指定事件(由目标过滤器定义)可能发生的估计概率。因此,评分值的范围介于0%~100%之间。该模型常用于在执行某个流程或发起某项促销活动之前,结合增益图和提升图预估可能产生的业务结果,图7-16为Data workbench倾向评分模型。

图7-15 Data workbench聚类结果

图7-16 Data workbench评分结果

但是,即使如此,针对流量数据的深度挖掘仍然还有很大的发展空间。因此,我们需要将更多的深度算法和模型应用到网站和流量分析工作中才能产生更大价值。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文