Press "Enter" to skip to content

利用机器学习进行有效的营销策略开发

使用机器学习成功构建营销策略的技巧和窍门

来自unsplash.com的图片

营销归因模型在今天被广泛用于构建营销策略。这些策略基于为每个客户旅程中的每个接触点分配信用。有许多不同类型的模型,尽管它们可以分为两组:单点归因模型和多点归因模型。通常情况下,您可以轻松解释和实施这些模型。它们甚至在某些罕见情况下可能有用。然而,它们中的大多数都无法独自构建一个强大的营销策略。问题在于所有这些模型要么基于可能不适用于某些数据/行业的规则进行操作,要么依赖有限的数据量,导致有价值的见解丧失。要了解更多关于营销归因模型类型的信息,请查看我的先前文章。

今天,我想讨论我们如何利用机器学习来开发营销策略,我们使用的数据以及我们取得的成果。在本文中,我们将回答以下问题:

  1. 在哪里更好地获取数据?
  2. 如何为模型训练准备数据?
  3. 如何有效利用模型预测并得出有意义的结论?

我将使用我们其中一位客户的数据进行演示,并进行一些修改。这些修改不会影响整体结果。让我们将这家公司称为XYZ。客户允许发布这些数据。

数据

有几种方法可以获取网站的流量日志。这些方法并不总是提供您可能需要进行分析的全面信息。然而,有时可以将一个来源集成到另一个来源中,而有时可以手动积累和组合来自多个来源的数据。您还可以自己编写脚本来收集必要的信息。现在,让我们简要介绍当前最受欢迎的一些来源以及您可以从中获取的数据:

Google Analytics

Google Analytics(GA4)是一个强大的平台,可以让您访问不同的网站分析工具,并允许您测量应用和网站的参与度和流量。它通常使用最后一次点击归因,但是您可以构建自定义的ML归因模型,收集以下GA4数据,例如:

  • 自动事件(如ad_click、ad_impression、app_exception、file_download、first_visit、page_view等);
  • 增强测量(滚动、点击、video_start、video_progress等);
  • 推荐事件(add_to_cart、begin_checkout、add_payment_info、purchase、add_to_wishlist等);
  • 自定义事件。

Google Analytics为不同行业提供了不同的事件。

Meta Pixel

Meta Pixel是一个工具,可以让您跟踪广告推广和访客在您的网站上的活动。它为您提供了关于您的Facebook和Instagram广告受众如何与广告交互以及这些用户点击广告后在您的网站上的行为的一些见解。总体上,您将获得与使用Google Analytics时相同的数据。然而,Meta Pixel更注重重新定位,因此您将获得比Google Analytics更多的相关工具。

Yandex Metrika

Yandex Metrika具有与上述服务相似的功能。但它有其优点和缺点。作为缺点,Yandex Metrika对于一个帐户的处理请求有限制(每天5,000个请求)。而Google Analytics的限制是每天200,000个请求。而优点是Yandex Metrika具有可以帮助您获取所有鼠标移动的Webvisor。

这并不是您可以用来获取用户数据的所有可用服务。尽管每个数据源中都有许多类型的数据,因此在选择数据源时,您可以注意易于配置报告和与其他产品集成等因素。我们选择了Google Analytics(GA4),因为它提供了全面的数据和方便的工具。此外,该数据可以轻松集成到BigQuery中,我们使用Google Cloud基础架构。因此,原始数据如下:

数据准备

回到我们的任务,我们的目标是确定哪些广告活动更具吸引力,以便在维持或增加收入水平的同时减少预算分配中的开支。因此,GA4数据的表示对我们来说很方便,因为它包含了关于每个用户行为/触点的信息,例如:

  • 按钮点击
  • 滚动
  • 图片查看
  • 搜索等

这些行为都可以进一步转化为微转化,这正是我们所需要的。我们将使用这组微转化来预测每个会话中用户进行购买的可能性。

在解决这样的问题时,以下微转化可能会引起我们的兴趣:

  • 访问销售页面
  • 查看热门或关键产品
  • 搜索特定尺寸
  • 查看产品照片
  • 查看所有产品照片
  • 查看产品护理信息
  • 将产品添加到购物车等

实际上,您可以根据自己的需要提出任意数量的微转化。选择微转化主要取决于您的店铺/业务的具体特点。

最后,我们为我们的模型选择了以下特征和微转化。我们所有特征的总数是97。这是我们特征的子集:

您可以看到许多与UTM相关的特征,它们的含义如下:

  • utm_source是用于创建VoAGI的平台或工具的名称;
  • utm_VoAGI标识流量的类型或高级渠道;
  • utm_campaign是营销活动的名称;
  • 其他utm特征指的是用户旅程或会话中的第一个触点。

让我们回到其他特征的讨论。一些列在原始数据中,所以您不需要对它们进行任何处理。然而,有些列不适合直接使用,需要进行一些操作。以下是我们如何获取一个微转化(例如将产品添加到购物车)的示例:

模型

我想提醒您,使用模型,我们希望在每个触点上获得用户进行购买的概率。然后,我们将这个概率转化为在一个会话内进行购买的概率。因此,我们使用了一个分类模型,其中我们利用了predict_proba来获取每个用户交互中购买的概率。在尝试了从线性到增强的几种模型后,我们决定使用CatBoostClassifier。在部署和每日重新训练模型之前,进行了超参数调整。我们不会深入讨论模型创建的细节,因为我们遵循了经典的超参数调整、后续模型训练和相关指标计算的方法。

现在,模型正在使用一个月的数据进行训练,因为将这个持续时间更改为更长或更短的期间并没有显示出显著的改进。此外,我们使用阈值0.1来确定购买。我们特意使用这个值,因为它比我们客户的基线购买概率高10倍。这对我们来说是一个触发器,可以考虑这些事件并调查是否已经进行了购买,如果没有,为什么没有进行购买。换句话说,模型的概率大于0.1的任何行为都被归类为购买。因此,我们获得了以下召回率和准确率指标的值:

测试集的召回率:0.947测试集的准确率:0.999

根据获得的指标,我们可以看到我们仍然漏掉了一些购买行为。可能是因为这些购买的路径与典型的用户旅程不同。

因此,我们拥有了所有的特征和模型概率,现在我们想要构建一个报告,了解哪些广告活动被低估,哪些被高估。为了获得广告活动,我们将组合utm_sourceutm_VoAGIutm_campaign特征。然后,我们将在每个用户会话中取最大概率,然后乘以与测试数据集相同时间范围内的平均订单价值。然后,我们通过计算每个广告活动的总和生成报告。

它给我们提供了以下报告:

现在我们需要转向营销指标。由于我们想要衡量营销活动的成功,我们可以考虑以下营销人员经常使用的指标:

  • ROAS(广告支出回报率)是衡量数字广告活动效果的营销指标;
  • CRR(成本收入比)衡量运营费用与企业收入之比。

我们将使用我们的数据计算它们,并与营销人员通常使用的最后一次点击归因获得的ROASCRR值进行比较。

利用机器学习进行有效的营销策略开发 四海 第2张

利用机器学习进行有效的营销策略开发 四海 第3张

由于我们只在分析期间看到了三个付费广告活动,我们将在GA4中找到这些广告活动的指标。并基于最后一次点击归因添加ROASCRR事实。我们在之前的文章中已经讨论了为什么最后一次点击归因不是评估广告活动贡献的准确方法。

使用上述公式,我们将计算出具有预测ROASCRR的最终报告:

现在我们有了所有的数据来得出关于广告活动的结论:

  • 我们可以看到广告活动“google/cpc/mg_ga_brand_all_categories_every_usa_0_rem_s_bas”被高估,因为其预测的ROAS比基于最后一次点击归因的ROAS低2倍。很可能,用户经常在点击此广告活动后进行购买,但他们已经是温暖的客户。
  • 广告活动“instagram / cpc / 010323_main”被低估,因为其预测的ROAS比事实ROAS高4倍。
  • 而广告活动“google / cpc / mg_ga_brand_all_categories_every_latvia_0_rem_s_bas”的预测ROAS与实际ROAS相似。

有了这些数据,您可以独立开发下一阶段的营销策略。同时,您不应忘记营销策略需要测试。然而,这超出了我们文章的范围。

在本文中,我们讨论了如何利用机器学习构建营销策略。我们涉及了数据选择、用于建模的数据预处理、建模过程本身以及从所获得的结果中得出的见解。如果您也在处理类似的任务,您所使用的方法对我也会很有兴趣。

感谢您的阅读!

我希望今天分享的见解对您有价值。如果您想与我联系,请随时在LinkedIn上添加我。

Leave a Reply

Your email address will not be published. Required fields are marked *