DeepMind在ICML 2022的最新研究

为更有效和高效的 AI 铺平通用系统之路 ‍

从2022年7月17日至23日，在美国马里兰州巴尔的摩会议中心举行的第三十九届国际机器学习大会（ICML 2022）即将开始，将以混合方式进行。

研究人员们将在人工智能、数据科学、机器视觉、计算生物学、语音识别等领域展示和发布他们在机器学习方面的尖端工作。

除了赞助会议并支持我们的长期合作伙伴 LatinX、Black in AI、Queer in AI和Women in Machine Learning组织的研讨会和社交活动之外，我们的研究团队还将呈现30篇论文，其中包括17个外部合作项目。以下是我们即将进行的口头报告和聚光灯报告的简要介绍：

有效的强化学习

使强化学习（RL）算法更加有效是构建通用 AI 系统的关键。这包括提高性能的准确性和速度，改进迁移学习和零样本学习，并降低计算成本。

在我们选择的一次口头报告中，我们展示了一种新的方法，通过应用一组策略的组合来改进强化学习算法（GPI），从而更有效地提高智能体的性能。另一次口头报告提出了一种新的基于实地和可扩展的方法，实现了高效的探索，无需奖励。同时，我们提出了一种方法，通过基于记忆的检索过程来增强 RL 智能体，减少其对模型容量的依赖，使其能够快速灵活地利用过去的经验。

语言模型的进展

语言是人类生活的基本组成部分。它赋予人们沟通思想和概念的能力，创造记忆，并建立相互理解。研究语言的各个方面对于理解智能如何在人工智能系统和人类中发挥作用至关重要。

我们的口头报告关于统一的缩放定律以及我们关于检索的论文都探讨了我们如何更高效地构建更大的语言模型。通过研究构建更有效的语言模型的方法，我们引入了一个新的数据集和基准测试 StreamingQA，评估模型如何随着时间的推移适应和遗忘新知识，而我们关于叙述生成的论文则展示了当前预训练语言模型由于短期记忆限制而在创建更长文本方面仍存在困难。

算法推理

神经算法推理是构建能够执行算法计算的神经网络的艺术。这个快速发展的研究领域在帮助将已知算法应用于现实世界问题方面具有巨大潜力。

我们引入了算法推理的 CLRS 基准测试，该基准测试评估神经网络对《算法导论》教材中的30个经典算法的执行能力。同样，我们提出了一种通用的增量学习算法，将回顾经验重放应用于自动定理证明，这是帮助数学家证明复杂定理的重要工具。此外，我们还提出了一种基于约束的学习模拟框架，展示了传统模拟和数值方法在机器学习模拟器中的应用，这是解决科学和工程中复杂模拟问题的重要新方向。

‍

在这里查看我们在 ICML 2022 的全部工作范围。