Press "Enter" to skip to content

数据质量问题对广告投资回报的隐藏成本

你的数据对于分辨哪些客户是你的摇钱树、哪些不是有很多话要说。不论你是在一家 B2B 公司担任生命周期营销经理,优化将免费试用用户转化为付费用户,还是在一家 B2C 电子商务公司担任数据科学家,优化让首次用户购买你的产品,每个用户对你来说都有价值。

领先的公司已经变得擅长根据用户与网站或产品的互动来预测不同阶段客户的终身价值。凭借这些数据,他们可以相应地调整竞价,有理由为一个可能在终身中额外产生 50 美元收益的用户多付 5 美元。

换句话说,你正坐拥一座金矿,你可以将其转化为预测,并直接输入到 Google 和 Meta 中,调整你的竞价策略,并通过为每个客户支付适当的价格来在市场中取胜。

来源:synq.io

影响客户终身价值 (CLTV) 计算的数据问题会导致基于错误假设的价值竞价。

但你的广告支出的回报只有你的客户终身价值计算得好才能实现。

平均规模为 250-500 人的公司使用了许多数据源,跨越了数百个表格,但并不总能对他们使用的数据的准确性有正确的可见性。这意味着他们将预算分配给错误的用户,并在此过程中浪费了成千上万美元。

在本文中,我们将深入探讨数据驱动营销团队在原始数据转换过程中面临的数据质量问题,这些问题作为基于价值竞价的广告平台的输入。我们将特别涉及以下领域:

  • 360 概览 —— 为什么全面了解整个营销数据栈很重要
  • 监控 —— 在营销流程中需要注意的常见问题
  • 人员和工具 —— 对齐人员和工具以构建可靠的营销数据流程的重要性

为什么你需要全面了解你的营销流程

为了了解每个客户的价值,你可以分析用户行为和数据点,这些都是强有力的指标。这通常会揭示出一系列预测因素,这些因素来自于数十个不同的系统。通过结合这些因素,你可以获得对你的客户的全面了解,并连接各个方面,以了解行为背后的关键驱动因素,这些行为和行动表明客户具有很高的价值。

例如,如果你是一家 B2B 公司的营销人员,你可能已经了解到驱使客户从免费用户转变为付费用户的因素。

  • 登录两次使客户转化的可能性增加 50%(Stripe)
  • 在 7 天内推荐他人使客户价值增加 70%(Segment)
  • 使用公司电子邮件地址和拥有 250+ 名雇员的用户更有可能成为付费客户(Clearbit)
  • 仅限移动端登录会使客户价值降低 30%(Amplitude)
来源:synq.io

大量的上游数据源进入数据仓库,然后发送到 Google 和 Facebook 进行广告竞价

没有全面的概览,你可能会错误地假设输入到竞价系统中的数据的准确性,然后后来才意识到关键问题,例如:

  • 由于 Clearbit/Segment 集成存在问题,从电子邮件域名中提取公司规模的准确性不高。
  • 事件跟踪冲突导致 Amplitude 中的结账流程中关键行动的数据丢失。
  • Stripe 集成的数据同步不准确,导致关于客户购买的信息不完整。

“由于第三方数据源出现问题,我们的 CLTV 计算出错了。我们不仅失去了当天在 Google 上花费的 10 万英镑,还不得不等待几天才能重新校准 CLTV 模型” —— 一家拥有 500 名员工的金融科技公司

在研究论文中,强调了多个因素在预测在线零售商ASOS的CLTV(客户终身价值)中的重要性。研究发现,关键因素包括订单行为(例如,订单数量,最近订单历史),人口统计信息(例如,国家,年龄),网络/应用会话日志(例如,上次会话以来的天数)和购买数据(例如,总订单价值)。这些洞察是通过数百次数据转换和数十个第三方来源的整合得出的。

ASOS – 确定CLTV的因素

来源:synq.io。研究论文中的数据

数据问题 – 已知未知和未知未知

拥有全面的数据概述还不够,重要的是积极识别可能影响CLTV计算的潜在问题。这些问题可以分为两类:

已知未知:已经发现并承认的问题,例如导致Google API在12小时内未同步数据的管道故障。

未知未知:可能未被注意到的问题,例如将产品分析事件数据错误同步到数据仓库,导致对用户行为的错误假设。

“我们每天在Facebook营销上花费5万美元,其中一个上游管道在3天内未同步,导致我们浪费了一半的预算。直到他们通知我们之前,我们都不知道发生了什么” – 250人的电子商务公司

为了积极识别和解决影响CLTV计算的数据问题,请考虑在以下领域进行监控:

来源:synq.io

逻辑测试:使用类似dbt的工具对不同的列和表应用假设。例如,确保user_id列是唯一的,order_id列永远不包含空值。实施额外的逻辑检查,例如验证电话号码字段只包含整数,或者平均订单大小不超过合理限制。

数据量:监控异常的数据量。例如,订单表中新行的突然增加可能表明来自错误数据转换的重复数据,或者反映了新产品的成功。

更新速度:了解所有数据表的最新刷新时间,因为数据管道故障可能在更详细的区域中未被注意到。例如,来自Clearbit的公司规模数据的集成问题可能会在不立即检测到的情况下持续存在。

分段:识别特定细分市场中的问题,例如错误标记某些产品类别,如果不进行适当的检查,可能很难检测到。

确定责任和所有权

一旦您全面了解了数据和监控系统,并确保各个方面的责任划分清晰,就可以为监控的不同方面确定责任人。在前面提到的示例中,数据所有权涵盖产品使用情况、人口统计信息、计费和订单。为相关来源和表分配责任人确保及时处理问题和解决方案。

“我们有一个重要的测试警报持续了几周而没有得到解决,因为接收警报的人已经离开了公司” – 英国金融科技独角兽

此外,要优先考虑数据产品的最关键组成部分,并建立服务级别协议(SLA)。定期评估运行时间和性能,以系统化的方式解决任何需要关注的问题。

总结

领先的公司使用来自许多来源的数据来准确预测每个客户的客户终身价值(CLTV)。这使他们能够优化广告竞价并针对最有利可图的客户。然而,您的广告支出的成功最终取决于CLTV计算的准确性,因此未发现的数据问题是一个重要的风险。

为了确保基于价值的广告竞价的高质量数据,我们建议重点关注两个关键领域:

  1. 360概述:如果没有全面的概述,您就有可能在竞标系统中假定数据的准确性,然后才发现关键问题。这些问题可能包括Amplitude等平台中的陈旧数据或与Clearbit的集成问题。
  2. 监控:积极主动地识别和解决影响CLTV计算的数据问题至关重要。实施监控流程,包括逻辑测试、数据新鲜度、数据量跟踪和分段分析。

通过优先考虑全面概述和积极监控,公司可以减轻与错误CLTV计算相关的风险,并提高基于价值的广告竞标策略的效果。

如果您在处理营销数据并考虑如何构建可靠的数据,我愿意与您交谈。请联系mikkel@synq.io。

Leave a Reply

Your email address will not be published. Required fields are marked *