Press "Enter" to skip to content

DeepMind在ICLR 2022的最新研究

致力于提高人工智能的普适性

今天,会议季正式开始,第十届国际学习表示会议(ICLR 2022)将于2022年4月25日至29日以虚拟形式举办。来自世界各地的参与者将齐聚一堂,分享他们在表示学习领域的前沿工作,从推动人工智能的最新技术到数据科学、机器视觉、机器人技术等等。

会议的第一天,我们的AI科学与强大可靠AI团队负责人Pushmeet Kohli将发表演讲,阐述人工智能如何大大改进解决各种科学问题的方法,从基因组学和结构生物学到量子化学,甚至纯数学。

除了作为赞助商和定期举办研讨会外,我们的研究团队今年还提交了29篇论文,其中包括10个合作项目。以下是我们即将进行的口头报告、焦点报告和海报展示的简要介绍:

优化学习

一些重要论文集中研究了我们如何使AI系统的学习过程更加高效。这包括提高性能、推动少样本学习,并创建数据高效的系统以减少计算成本。

在《自举式元学习》中,我们提出了一种算法,使代理能够通过自我教学来学习如何学习。我们还提出了一种策略改进算法,重新设计了AlphaZero——我们的系统从零开始自我训练并精通国际象棋、将棋和围棋——即使在少量模拟训练的情况下,也能不断改进;一种能够降低RL代理和环境中容量丧失风险的正则化器;以及一种改进的架构,可以高效地训练注意力模型。

探索

好奇心是人类学习的关键部分,有助于推进知识和技能的发展。同样,探索机制使得AI代理能够超越现有知识,发现未知或尝试新事物。

在《代理何时进行探索》中,我们研究了代理何时应该切换到探索模式,以及在什么时间尺度上切换和哪些信号最能确定探索期间的持续时间和频率。在另一篇论文中,我们引入了一种“信息增益探索奖励”,使代理能够摆脱RL中内在奖励的限制,从而能够学习更多的技能。

强大的人工智能

要在现实世界中部署ML模型,它们必须在训练、测试和新数据集之间有效。理解因果机制是至关重要的,它使一些系统能够适应新的挑战,而其他系统则难以应对。

通过扩展对这些机制的研究,我们提出了一个实验框架,可以对分布转变的鲁棒性进行细粒度分析。鲁棒性还有助于防范意外或有针对性的对抗危害。在图像破坏的情况下,我们提出了一种技术,理论上优化图像到图像模型的参数,以减少模糊、雾化和其他常见问题的影响。

新兴通信

除了帮助机器学习研究人员了解代理如何演化其自身的通信以完成任务之外,AI代理还有潜力揭示人群中语言行为的见解,这可能导致更具互动性和实用性的AI。

与Inria、Google Research和Meta AI的研究人员合作,我们将人类种群内的多样性对塑造语言的作用与在神经代理人计算机模拟中部分解决的矛盾联系起来。然后,因为在AI中构建更好的语言表示对于理解新兴通信非常重要,我们还研究了数据集规模、任务复杂性和种群规模作为独立因素的重要性。此外,我们还研究了在多个代理人相互通信以实现共同目标的游戏中表达能力、复杂性和不可预测性之间的权衡。

查看我们在ICLR 2022的全部工作范围,请点击这里。

Leave a Reply

Your email address will not be published. Required fields are marked *