Press "Enter" to skip to content

DeepMind在NeurIPS 2022会议上的最新研究

推动最佳大型模型、计算优化的强化学习智能体和更透明、道德和公平的人工智能系统

第36届神经信息处理系统国际会议(NeurIPS 2022)将于2022年11月28日至12月9日在美国新奥尔良举行,作为混合活动。

NeurIPS是全球最大的人工智能(AI)和机器学习(ML)会议,我们很自豪成为钻石赞助商,支持该会议促进AI和ML社区的研究进展交流。

DeepMind的团队将在虚拟小组讨论和海报展示中展示47篇论文,其中包括35个外部合作项目。以下是我们正在展示的一些研究的简要介绍:

最佳大型模型

大型模型(LMs)是基于大量数据训练的生成性AI系统,在语言、文本、音频和图像生成等领域取得了令人难以置信的表现。它们的成功部分归功于它们的规模。

然而,在Chinchilla中,我们创建了一个拥有700亿个参数的语言模型,其表现超过了包括Gopher在内的许多更大的模型。我们更新了大型模型的扩展规律,并展示了之前训练的模型对于所进行的训练来说过于庞大。这项工作已经影响了遵循这些更新规则的其他模型,创造了更精简、更优秀的模型,并在会议上获得了杰出的主要论文奖。

在Chinchilla和我们的多模态模型NFNets和Perceiver的基础上,我们还介绍了Flamingo,一组少样本学习的视觉语言模型。Flamingo可以处理图像、视频和文本数据,它在广泛的开放式多模态任务上取得了最新的技术水平。

然而,规模和架构并不是基于Transformer的模型的唯一重要因素。数据属性也起着重要的作用,我们将在一个关于数据属性如何促进Transformer模型的上下文学习的演示中进行讨论。

优化强化学习

强化学习(RL)作为一种创造广义人工智能系统的方法已经显示出巨大的潜力,它可以解决各种复杂任务。它已经在许多领域取得了突破性进展,从围棋到数学,我们始终在寻找使RL智能体更智能、更精简的方法。

我们介绍了一种新方法,通过大幅扩展供决策的信息规模,以计算高效的方式提升RL智能体的决策能力。

我们还将展示一种在视觉复杂环境中的好奇心驱动探索的简单而通用的方法——一个名为BYOL-Explore的RL智能体。它在超越人类水平的性能上表现出鲁棒性,而且比之前的工作要简单得多。

算法进展

从压缩数据到运行天气预报模拟,算法是现代计算的基本组成部分。因此,当在规模上工作时,渐进式改进可能会产生巨大的影响,帮助节省能源、时间和金钱。

我们分享了一种基于神经算法推理的自动配置计算机网络的全新、高度可扩展的方法,显示出我们高度灵活的方法比现有技术水平快多达490倍,同时满足大部分输入约束。

在同一场次上,我们还对之前理论概念“算法对齐”进行了深入探索,突出了图神经网络和动态规划之间的微妙关系,以及如何最佳地结合它们以优化超出分布的性能。

负责任的开拓者

DeepMind使命的核心是我们承诺在人工智能领域担任负责任的开拓者。我们致力于开发透明、道德和公平的人工智能系统。

解释和理解复杂人工智能系统的行为是创建公平、透明和准确系统的重要组成部分。我们提供了一系列能够体现这些抱负的准则,并描述了一种实际的方式来满足这些准则,包括训练一个能够建立自身因果模型的人工智能系统,使其能够以有意义的方式解释自己的行为。

为了在世界上安全而负责任地行动,人工智能智能体必须能够思考伤害并避免有害的行为。我们将介绍关于一种名为反事实伤害的新统计度量的协作工作,并展示它如何克服标准方法的问题,以避免追求有害的策略。

最后,我们呈现了我们的新论文,提出了诊断和缓解模型公平性失败的方法,这些失败是由分布偏移引起的,展示了这些问题对于在医疗保健环境中部署安全的机器学习技术的重要性。

在NeurIPS 2022中,您可以看到我们所有的工作范围,请点击这里。

Leave a Reply

Your email address will not be published. Required fields are marked *