应用因果机器学习来精简活动目标受众
作为一名初出茅庐的数据科学家,我的学术背景教会我将准确性视为成功项目的标志。然而,行业关心的是短期和长期内的赚钱和节省开支。本文是关于ROI(投资回报)的一堂课——商业行动的圣杯。
大部分推广活动的目标不是直接针对个人,而是针对客户群体。这些活动包括付费搜索、展示广告、付费社交等等。另一方面,直接面向个人客户的活动包括直邮、电子邮件、短信甚至推送通知。银行和金融科技领域的企业能够进行大规模的直接面向个人客户的活动,因为每个人都有应用程序。但如今,这些企业希望在推广开支方面更加高效(如何实现?)。
理解问题
在这个背景下,让我们来谈谈信用卡发行商Flex。他们提供首年免费,也就是说,第一年没有年费。从第二年开始,他们会收取全额年费。在过去的三年中,他们观察到年度续卡率很低,只有30%的持卡人在第一年后继续使用该卡。Flex决定为一些选择的客户尝试续卡优惠,以继续扩大他们的客户群体。问题是,如果我们不小心,这种策略可能会很昂贵。
作为数据科学家,我们的任务是从500万即将续约的客户名单中为他们准备最小的目标客户群体。
提升建模简介
多年来,数据科学家一直致力于构建响应模型,以预测客户对直接推广活动的响应可能性。对于新兴企业来说,这种模型可能有效,但随着品牌的成熟,人们的问题也在不断演变。
响应模型无法解决的问题包括:
- 如果客户接受了一项活动,他们更有可能做出反应吗?
- 我们如何优先考虑那些有流失风险的客户?他们是谁?
- 是否有可能有客户对促销信息做出消极反应?他们是谁?
- 我们如何在不影响增量收入的情况下减少活动的目标客户群体?
这就是提升建模的作用。它是一种机器学习技术,可预测一项治疗措施对个体购买行为的增量影响,而不仅仅是行为的可能性。通过这种方式,您可以针对最有可能受到您活动影响的客户,并避免浪费资源用于不会受到影响的客户。这提高了活动的投资回报和客户满意度。

您可能以前见过这种分类的客户。Sure things对您的品牌或产品有很强的亲和力,无论如何都会购买。Lost causes不需要您的产品。推广活动不太可能影响这两类客户。Sleeping dogs是那些在没有推广的情况下可能会购买的客户。而Persuadables则是最大的机会——只有在进行营销活动后才会购买。 他们提高了活动的投资回报。
在这个任务中,我们首先需要识别出Persuadables。其次,为每个人找到最合适的优惠。
准备信用卡客户数据集
我们有一个500万名客户的数据集,他们的使用期为10个月,也就是说他们还有2个月续约的时间。这是一个模拟的客户数据,您可以使用此Python代码自行创建。

我们需要在这里进行一些EDA,并且我已经使用了ydata-profiling(以前称为Pandas Profiling)工具生成了一个交互式报告。


我们有20个客户变量 – 包括定性变量(如年龄,收入层次)和定量变量(交易,类别消费)。其中一些变量之间存在较高的相关性。
试点测试 – 对以前的续订活动进行更详细的研究
Flex已经对50,000名客户进行了类似下面这样的试点活动。
我们很高兴地通知您,您的信用卡符合续订条件,并提供特别优惠。在有限的时间内,您可以以仅49美元的低年费续订您的信用卡,与常规年费相比可节省高达50%。这个优惠仅适用于像您一样忠诚的长期客户,他们已经使用我们的信用卡超过一年。
根据客户在第二年支付的金额,有3种不同的优惠 – 30%,50%或70%。从该活动中得出的结论是,接受处理的客户保留率为55%,比支付全年费的对照组提高了25%(55减去30)。这被称为平均处理效应(ATE)。

我们有活动结果,可以用来优化下一个活动。为此,我们必须计算每个客户的条件平均处理效应(CATE) – 这是指在客户层面上的效应的一个花哨的名称。
注意 – 试点活动是在较大规模推出促销或营销策略之前进行的小规模测试。它允许营销人员评估策略的有效性,可行性和成本,并识别和解决任何问题或挑战。试点活动可以帮助优化营销计划,增加投资回报率,并降低失败风险。
倾向性评分匹配 – 获取代表性对照组
倾向性评分匹配(PSM)旨在根据观察到的特征,匹配具有类似接受治疗可能性的客户。在观察性研究中,随机分配治疗是不可能的,PSM可以帮助减少混杂变量引起的偏差。它涉及估计每个客户的倾向性评分,这些评分是给定协变量的条件治疗概率,然后将接受治疗和未接受治疗的客户进行匹配。
由于在试点活动中有3种不同的处理方式,我将使用PSM为每个处理组近似一个相同的对照组。例如 – 一组类似于支付全年费的对照组客户,这些客户与接受年费x 30%处理的客户类似。类似地,对于年费x 50%和年费x 70%的组。这将消除在实验设置中的任何混杂变量,我们将能够确定每个处理组的真实提升。
通常,倾向性评分是使用简单的逻辑回归模型进行计算的。我还建议使用诸如psmpy等能够很好地处理类别不平衡的包。
特征选择 – 导致提升增加的因素
在倾向性评分匹配之后,我们有3对数据集 – (控制组₃₀,处理组₃₀)(控制组₅₀,处理组₅₀)(控制组₇₀,处理组₇₀)
我已经使用这些对建立了3个模型,每个处理组一个,使用CausalML库中的X-learner算法。SHAP值可以用于检查哪些特征与提升相关联。

评估X-学习模型
我们构建了3个Qini曲线,从最高到最低的CATE,我们可以看到将客户添加到目标中的累积提升。它类似于传统机器学习中的ROC曲线。较低的线是随机分配到治疗/对照组的提升。在这里,我们报告提升曲线下面积或Qini分数-分数越高越好。

正如预期的那样,年费x 30%的治疗方法具有最高的Qini分数。现在模型已经准备好,我们可以将它们应用于新数据。
预测样本外提升-设计下一次活动
我们转向500万需要续订的客户。我们可以选择向他们提供年费x 30%,年费x 50%或年费x 70%的选择。或者我们不给他们提供任何优惠-全年费。通过三个X-学习器,我预测每个人的CATE。具有最大CATE的治疗方法将是最佳治疗方法。如果所有治疗方法的CATE相似(在彼此的+-10%范围内),那么我们选择年费x 70%的治疗方法(当然,我们希望获得更高的收入)。如果最大CATE为负,则我们不会向该客户推销(他们是沉睡的潜在客户)。

这是我们的最佳分配方案。大约有50万客户不建议采用治疗方法。

在这种类型的表示中(见下文),我们根据CATE将客户分为十分位。第1分位具有最高的CATE,第10分位具有最低的CATE。如果我们给所有客户提供一种治疗方法,我们可以看到较低的分位数更早地下降到0以下。因此,我们将坚持我们下一次活动的最佳治疗方法。

Qini曲线告诉我们,我们预计这次活动将带来相当大的提升。曲线上没有明确的截断点或拐点来区分可说服客户。

增量响应-我们应该针对哪些客户?
下次活动的平均提升预计为0.052。具有高于平均提升的分位数是可定位的客户。但为了节约成本,我们只选择前20%并称他们为可说服客户。具有负提升的分位数是沉睡的潜在客户。其余的要么是确定的要么是无望的。
在这个改进的最佳治疗方法图中,容易可视化可说服客户。在这种情况下,他们是前5个分位数。

我们无法向业务团队报告提升效果,所以让我们将其转化为增量投资回报率(Incremental ROI)和收入规模。对于第d组,增量投资回报率为
收入是第d组的续约费用总额。活动成本是Flex自行承担的续约费用的一部分。我们可以看到,只有向前7个组或前70%的客户提供折扣才会有盈利。

前20%的客户(即可说服的客户)预计将贡献这500万客户续约总收入的80%。这在业务中经常被观察到,被称为帕累托原则。同样,也可以构建这样的条形图来了解营销活动的长期投资回报率(CLV,即客户终身价值)。

那么,要回答“我们应该以谁为目标?”这个问题,即可说服的客户约有100万人。我们如何个性化地为他们提供优惠?我们使用具有最高条件平均处理效应的最佳处理方式。
结论
通过这种方式,Uplift建模识别出将为营销活动带来最大增量投资回报率的客户,并相应地针对他们进行目标定位。通过这样做,Uplift建模优化了营销活动的投资回报率并减少了浪费性支出。
希望您觉得这篇文章有用且信息量丰富,并且在您的下一次促销或营销活动中尝试使用Uplift建模。
Uplift建模通常应用于D2C(直销)类的营销活动,如直邮、电子邮件、短信或应用程序通知。 如果您希望优化付费媒体,请参阅我的系列文章: 营销组合建模。
谢谢阅读!😄