Press "Enter" to skip to content

得分!NVIDIA团队在推荐系统中获得奖杯

一支由五位机器学习专家组成的NVIDIA团队遍布四大洲,在一场激烈竞争的声望赛事中赢得了三项任务,建立了最先进的推荐系统。

这些结果反映了该团队运用NVIDIA人工智能平台解决数字经济引擎的实际挑战的能力。推荐系统每天为数十亿人提供数以万计的搜索结果、广告、产品、音乐和新闻故事。

在亚马逊KDD Cup ’23中,超过450支数据科学家团队参赛。这场为期三个月的挑战经历了不少曲折和紧张的结局。

进入高速挡

在比赛的前10周,该团队一直处于领先地位。但在最后阶段,组织者切换到新的测试数据集,其他团队迎头赶上。

NVIDIAN团队加班加点,夜以继日地工作,以迎头赶上。团队成员从柏林到东京的不同城市留下了一串串日夜不停的Slack消息。

“我们一直在不停地工作,这非常令人兴奋,”圣地亚哥的团队成员Chris Deotte说道。

换个名字也是产品

最后一个任务是最难的。

参赛者需要根据用户浏览会话的数据预测用户会购买哪些产品。但训练数据中并没有包含许多可能的选择的品牌名称。

“我从一开始就知道,这将是一个非常非常困难的测试,”Gilberto“Giba”Titericz说道。

KGMON来拯救

Titericz位于巴西库里奇巴,是Kaggle竞赛中四位伟大大师级别的团队成员之一,这是数据科学的在线奥林匹克。他们是一支机器学习忍者团队,赢得了数十个比赛。NVIDIA创始人兼首席执行官Jensen Huang称他们为KGMON(NVIDIA的Kaggle大师),这是对宠物小精灵的戏仿。

Titericz在数十次实验中使用大型语言模型(LLMs)构建生成性人工智能来预测产品名称,但都没有成功。

在一次创造性的灵光乍现中,团队发现了一个变通方法。使用他们的新的混合排序/分类器模型进行预测非常准确。

最后冲刺

在比赛的最后几个小时里,团队争分夺秒地将所有模型打包在一起进行最后的提交。他们整夜在多达40台计算机上进行实验。

东京的KGMON成员小野寺一直感到紧张。“我真的不知道我们的实际得分是否与我们估计的一致,”他说。

得分!NVIDIA团队在推荐系统中获得奖杯 四海 第1张
四位KGMON成员(从左上角顺时针):小野寺、Titericz、Deotte和普吉特。

同样是KGMON成员的Deotte回忆说:“大约100个不同的模型一起工作,产生一个单一的输出……我们将其提交到排行榜,然后一触即发!”

该团队在AI界相当于照片结束线上稍微领先于最接近的对手。

迁移学习的力量

在另一个任务中,团队需要从英语、德语和日语的大型数据集中汲取经验,并将其应用于法语、意大利语和西班牙语的十分之一大小的数据集。这是许多公司在扩大全球数字业务时面临的现实挑战。

位于巴黎以外的三次Kaggle大师Jean-Francois Puget知道有效的迁移学习方法。他使用预训练的多语言模型对产品名称进行编码,然后微调编码。

“使用迁移学习极大地提高了排行榜得分,”他说。

融合聪明才智和智能软件

KGMON的努力表明,推荐系统领域有时更多的是艺术而非科学,是一种将直觉和迭代相结合的实践。

这是编码到软件产品中的专业知识,如NVIDIA Merlin,一个帮助用户快速构建自己的推荐系统的框架。

得分!NVIDIA团队在推荐系统中获得奖杯 四海 第2张
Merlin框架提供了一个端到端的解决方案,用于构建推荐系统。

位于柏林的团队成员Benedikt Schifferer是Merlin设计团队的一员,他使用该软件训练了能够击败竞争对手的经典推荐系统任务的转换器模型。

“梅林提供了出色的成果,而且灵活的设计让我能够为特定挑战定制模型,”他说。

驾驶RAPIDS

像他的队友一样,他还使用了RAPIDS,这是一组用于加速GPU上数据科学的开源库。

例如,Deotte从NGC中获取了代码,NGC是NVIDIA的加速软件中心。名为DASK XGBoost的代码帮助将一个大型复杂任务分布到八个GPU及其内存中。

就他自己而言,Titericz使用了一个名为cuML的RAPIDS库来在几秒钟内搜索数百万个产品比较。

团队专注于基于会话的推荐系统,该系统不需要来自多个用户访问的数据。在当今许多用户希望保护其隐私的情况下,这是一种最佳实践。

了解更多信息:

  • 观看一个关于使用梅林构建基于会话的推荐系统的GTC会议。
  • 参加NVIDIA深度学习研究所的推荐系统课程。
  • 查看NVIDIA AI Enterprise中的下一个项目预测工作流程,这是一个完整的软件套件,具备企业所需的安全性和支持。
  • 并观看下面的视频。

Leave a Reply

Your email address will not be published. Required fields are marked *