Press "Enter" to skip to content

四海吧 Posts

数据、架构还是损失函数:对多模态Transformer成功起到了最大贡献的是什么?

在这项工作中,我们研究了多模态变压器(注意力,损失和预训练数据)在多模态预训练中的成功的关键因素我们发现,多模态注意力,即语言和图像变压器相互关注,对这些模型的成功至关重要具有其他类型注意力的模型(即使具有更深或更多参数)无法达到具有多模态注意力的更浅更小模型的可比结果

Leave a Comment

博弈论作为大规模数据分析的引擎

现代人工智能系统处理识别图像中的物体和预测蛋白质的三维结构等任务,就像一个勤奋的学生为考试做准备一样通过在许多示例问题上进行训练,它们随着时间的推移减少错误,直到取得成功但这是一项孤独的努力,只是已知学习形式之一学习也可以通过与他人互动和游戏来进行一个人很少能够独自解决极其复杂的问题通过使问题解决具有类似游戏的特性,之前DeepMind的努力已经训练出能够玩捉旗战并在星际争霸中达到大师级别的AI代理这让我们想知道,基于博弈论的这种视角是否能够帮助解决其他基本的机器学习问题

Leave a Comment

将AlphaFold的力量交到世界的手中

去年12月我们宣布AlphaFold 2时,它被誉为解决了50年来的蛋白质折叠难题上周,我们发布了科学论文和源代码,解释了我们是如何创建这个高度创新的系统的,今天我们分享了人体中每一种蛋白质的形状的高质量预测,以及其他20种科学家在研究中依赖的生物体的蛋白质的预测

Leave a Comment

一般情况下,能够胜任的代理人是从无穷尽的游戏中出现的

近年来,人工智能代理在各种复杂的游戏环境中取得了成功例如,AlphaZero在开始时只知道如何玩基本规则,却击败了国际象棋、将棋和围棋的世界冠军程序通过强化学习(RL),这个单一系统通过不断重复的试错过程来通过一轮又一轮的游戏学习但是AlphaZero仍然要单独训练每个游戏,不能简单地学习另一个游戏或任务而不需要从头开始重复RL过程强化学习的其他成功案例,如Atari、捉旗、星际争霸II、Dota 2和捉迷藏等,也是如此DeepMind致力于解决智能问题,推动科学和人类进步,这使我们探索如何克服这个限制,创建具有更通用和适应性行为的AI代理这些代理不再一次学习一个游戏,而是能够适应全新的条件,并玩遍各种游戏和任务,包括以前从未见过的

Leave a Comment

好奇心是你所需要的一切吗?关于好奇探索中新兴行为的效用

我们认为,仅仅将好奇心用于快速环境探索或作为特定任务的额外奖励,并不能充分发挥这种技术的潜力,也会错过一些有用的技能相反,我们建议将重点转向保留在好奇心学习中出现的行为我们认为,这些自我发现的行为可以作为一个代理人解决相关任务的宝贵技能

Leave a Comment

预测下一小时的降雨情况

我们的生活与天气息息相关根据一项研究,在英国的任何时刻,据说有三分之一的人在过去一小时内谈论过天气,反映了天气在日常生活中的重要性在各种天气现象中,雨水尤为重要,因为它对我们的日常决策产生影响我应该带把伞吗?对于经历大雨的车辆应该如何规划路线?对于户外活动我们应该采取哪些安全措施?会不会发生洪水?我们最新的研究和先进的模型推动了降水即时预报科学的发展,即对未来1-2小时内雨水(和其他降水现象)的预测在与英国气象局合作撰写并发表于《自然》杂志的一篇论文中,我们直接应对了这个重要的天气预报大挑战这种环境科学与人工智能的合作关注为决策者创造价值,为雨水即时预报开辟了新的途径,并指出了人工智能在支持我们应对不断变化环境下的决策挑战中的机会

Leave a Comment

使用人工智能预测基因表达

当人类基因组计划成功地绘制了人类基因组的DNA序列时,国际研究界对于能够更好地理解影响人类健康和发展的遗传指令感到兴奋DNA携带了决定从眼睛颜色到易感染某些疾病和疾病的遗传信息人体内大约有2万个DNA片段,即基因,包含有关蛋白质的氨基酸序列的指令,这些蛋白质在我们的细胞中执行许多重要功能然而,这些基因仅占基因组的不到2%剩下的碱基对——占基因组中30亿个“字母”的98%——被称为“非编码”,包含着关于基因在人体中何时何地应该产生或表达的较少理解的指令在DeepMind,我们相信人工智能可以解开这类复杂领域的更深层次理解,加速科学进步,并为人类健康带来潜在益处

Leave a Comment

为机器人开放一个物理模拟器

当你行走时,你的脚与地面接触当你写字时,你的手指与笔接触物理接触是实现与世界互动的关键然而,对于如此常见的事件来说,接触是一个令人惊讶的复杂现象接触发生在两个物体界面的微观尺度上,可以是软或硬、有弹性或有弹性、滑或粘难怪我们的指尖有四种不同类型的触觉传感器这种微妙的复杂性使得模拟物理接触——机器人研究的重要组成部分——成为一项棘手的任务

Leave a Comment

AGI的现实挑战

当人们想象一个拥有人工通用智能(AGI)的世界时,更容易想到的是机器人,而不是解决社会最棘手问题的解决方案但我相信后者更接近于真相人工智能已经在解决基本挑战方面取得了巨大的进展:从解决蛋白质折叠到准确预测天气模式,科学家们越来越多地使用人工智能来推断支撑高度复杂现实世界领域的规则和原则,这些领域是他们可能从未在没有帮助的情况下发现的人工通用智能研究的进展将极大地增强社会应对和管理气候变化的能力,这不仅因为气候变化的紧迫性,还因为其复杂而多方面的性质

Leave a Comment

无监督深度学习在单个下颞面部区域神经元中识别语义分离

我们的大脑拥有处理视觉信息的惊人能力我们只需匆匆一瞥复杂的场景,就能在毫秒内将其解析为对象及其属性,例如颜色或大小,并利用这些信息用简单的语言描述场景这种看似毫不费力的能力背后,是我们的视觉皮层进行的复杂计算,它涉及将从视网膜传来的数百万个神经脉冲转化为更有意义的形式,以便将其映射到简单的语言描述上为了完全理解这个过程在大脑中是如何工作的,我们需要弄清楚语义上有意义的信息如何在视觉处理层次的末端神经元的激活中表示,以及这种表示如何从大多数未教授的经验中学习

Leave a Comment

规模化语言建模:Gopher、道德考虑和检索

语言及其在展示和促进理解或智能方面的作用是人类生活的基本组成部分它赋予人们交流思想和概念、表达想法、创建记忆和建立相互理解的能力这些是社交智能的基础部分这也是为什么我们在DeepMind团队研究语言处理和交流方面的因素,无论是在人工智能代理中还是在人类中

Leave a Comment

一个通用智能体

受到大规模语言模型进展的启发,我们采用类似的方法来构建一个超越文本输出领域的通用单一智能体我们将这个智能体称为Gato,它是一个多模态、多任务、多具身的通用策略相同的网络和相同的权重可以在Atari游戏中进行游戏、为图像加标题、聊天、使用真实的机械臂堆叠方块等等,根据上下文决定是输出文本、关节扭矩、按钮按下或其他标记

Leave a Comment

从乐高比赛到DeepMind的机器人实验室

如果你想进入DeepMind,就去争取吧申请,面试,只要尝试你可能第一次不成功,但这并不意味着你不能再试一次我从未想过DeepMind会接受我,当他们接受我时,我以为是个错误每个人都怀疑自己 – 我从未觉得自己是房间里最聪明的人我经常感到相反但我已经学到了,尽管这些感受,我确实属于这里,我确实值得在这样的地方工作对我来说,这个旅程就是从尝试开始的

Leave a Comment

动态语言理解:在参数化和半参数化模型中适应新知识

为了研究半参数问答模型及其基础的参数化语言模型(LMs)如何适应不断演化的知识,我们构建了一个新的大规模数据集,名为StreamingQA该数据集包含特定日期上人工编写和生成的问题,这些问题可以从14年时间戳新闻文章中回答我们每个季度对我们的模型进行评估,让它们阅读预训练中未见过的新文章我们证明了参数化模型可以进行更新,而无需完全重新训练,同时避免了灾难性遗忘

Leave a Comment

吉尔吉斯斯坦到国王十字车站:烹饪代码的明星面点师

我的工作日可能会有所不同,这取决于项目的哪个阶段假设我们想要为产品添加一个功能 – 我的任务可能包括设计解决方案并与团队合作找到最佳方案,部署新功能到生产环境并进行维护在此过程中,我会与利益相关者沟通变更,编写文档,编码和测试解决方案,构建分析仪表板,清理旧代码和修复错误

Leave a Comment

从电机控制到具身智能

使用人类和动物的动作教导机器人运球,并使用模拟人形角色搬运箱子和踢足球 通过试错让人形角色学习穿越障碍赛道,可能导致个体化的解决方案。Heess等人的“富环境中的运动行为的出现”(2017) 五年前,我们接受了一个挑战,教导一个完全可动的人形角色穿越障碍赛道。这展示了通过试错学习可以实现的增强学习(RL)的成果,但也凸显了解决具体化智能的两个挑战: 重复使用先前学到的行为:需要大量数据让代理“站稳脚跟”。没有任何关于每个关节施加多大力量的初始知识,代理开始随机地抽搐身体,很快摔倒在地。可以通过重复使用先前学到的行为来缓解这个问题。 个体化的行为:当代理最终学会穿越障碍赛道时,它会以不自然(但有趣)的运动模式进行操作,这对于机器人等应用来说是不实际的。 在这里,我们描述了一种解决这两个挑战的方法,称之为神经概率运动基元(NPMP),其中包括从人类和动物身上得出的运动模式的引导学习,并讨论了这种方法在我们今天在《科学机器人》上发表的“人形足球”论文中的应用。 我们还讨论了这种相同的方法如何使人形角色能够从视觉中进行全身操纵,例如携带物体,以及在现实世界中进行机器人控制,例如运球。 使用NPMP将数据提炼为可控制的运动基元 NPMP是一个通用的运动控制模块,可将短期运动意图转化为低级控制信号,并通过离线或通过RL来模仿运动捕捉(MoCap)数据进行训练,该数据是通过在执行感兴趣的动作的人类或动物身上放置追踪器记录的。 一个代理学习模仿MoCap轨迹(以灰色显示) 该模型由两部分组成: 编码器将未来的轨迹压缩为运动意图。 低级控制器根据代理当前状态和运动意图产生下一个动作。 我们的NPMP模型首先将参考数据提炼为低级控制器(左图)。然后,这个低级控制器可以作为即插即用的运动控制模块用于新任务(右图) 训练后,低层控制器可以被重复使用来学习新的任务,其中高层控制器被优化为直接输出电机意图。这样可以实现高效的探索-因为即使是随机采样的电机意图,也可以产生连贯的行为-并限制最终解决方案。 机器人足球中的新兴团队协作 足球一直是具有体现智能研究的长期挑战,需要个体技能和协调的团队合作。在我们最新的工作中,我们使用一个NPMP作为先验知识来指导运动技能的学习。 结果是一个团队的球员,他们从学习追球技能逐渐进步到学习协调。在之前的研究中,我们曾经展示过在相互竞争的团队中可以出现协调行为。NPMP使我们能够观察到类似的效果,但在需要更高级的电机控制的场景中。 代理首先模仿足球运动员的动作学习一个NPMP模块(顶部)。使用NPMP,代理然后学习足球特定的技能(底部)。 我们的代理获得了包括灵活的运动、传球和分工等技能,这些技能通过一系列统计指标来展示,包括在现实世界体育分析中使用的指标。球员们展示了既有灵活的高频电机控制,又有涉及对队友行为的预期的长期决策,从而实现了协调的团队合作。 一个代理通过多智能体RL学习足球竞技。 全身操控和使用视觉进行认知任务 学习使用手臂与物体交互是另一个困难的控制挑战。NPMP也可以实现这种全身操控。通过少量的MoCap数据,我们能够训练一个代理人使用自我中心视野,仅凭稀疏的奖励信号,将一个箱子从一个位置搬到另一个位置: 通过少量的MoCap数据(顶部),我们的NPMP方法可以解决搬运箱子的任务(底部)。 同样,我们可以教会代理人接住和扔球:…

Leave a Comment

我们的原则如何帮助定义AlphaFold的发布

我们的操作原则已经成为我们承诺优先考虑普遍利益的表征,同时也定义了我们拒绝追求的研究和应用领域自从DeepMind成立以来,这些原则一直是我们决策的核心,随着人工智能领域的变化和发展,我们也在不断完善它们这些原则旨在适应我们作为一个以研究驱动的科学公司的角色,并与谷歌的人工智能原则保持一致

Leave a Comment