深入探讨用于去偏倚排序模型的最新技术
推荐系统是当今世界上最普遍的机器学习应用之一。然而,基础的排名模型受到了许多偏倚的困扰,这可能严重限制了最终推荐的质量。构建无偏倚的排名器——也称为无偏倚学习排名(ULTR)——仍然是机器学习领域最重要的研究问题之一,远未解决。
在本文中,我们将深入探讨一种相对较新的建模方法,该方法使行业能够非常有效地控制偏倚,从而构建出卓越的推荐系统:双塔模型,其中一座塔学习相关性,另一座(浅层)塔学习偏倚。
尽管双塔模型可能已经在行业中使用了几年,但首次正式向更广泛的机器学习社区介绍它们的论文是2019年华为的PAL论文。
PAL(华为,2019年)——原始双塔模型
华为的PAL(“位置感知学习排名”)论文考虑了华为应用商店中的位置偏倚问题。
在整个行业中,排名模型中反复观察到位置偏倚。简单地说,这意味着用户更有可能点击显示在前面的物品。这可能是因为他们赶时间,因为他们盲目地相信排名算法,或者其他原因。以下是华为数据中展示位置偏倚的图表:

位置偏倚是一个问题,因为我们根本无法知道用户是否点击第一项是因为它确实是最相关的,还是因为它被首先展示出来——在推荐系统中,我们的目标是解决前者的学习目标,而不是后者。
PAL论文中提出的解决方案是将学习问题分解为:
p(点击| x,位置) = p(点击|已看到,x) x p(已看到|位置),