Press "Enter" to skip to content

将AlphaFold的力量交到世界的手中

在2022年7月,我们发布了AlphaFold蛋白质结构预测,涵盖了几乎所有已知的科学目录中的蛋白质。在此处阅读最新博客。

今天,我非常自豪和激动地宣布,DeepMind正在对人类对生物学的理解做出重大贡献。

去年12月,当我们宣布AlphaFold 2时,它被誉为解决了50年来的蛋白质折叠问题。上周,我们发表了科学论文和源代码,解释了我们如何创建这个高度创新的系统,今天我们分享了人体内每个蛋白质的形状的高质量预测结果,以及科学家依赖其研究的其他20个生物体的蛋白质。

当研究人员寻找治疗疾病和解决人类面临的其他重大问题(包括抗生素耐药性、微塑料污染和气候变化)时,他们将从对蛋白质结构的新洞察中受益。蛋白质就像微小而精致的生物机器。蛋白质的结构告诉我们它的功能,就像机器的结构告诉我们它的功能一样。今天,我们分享了一个宝库,使人类对人类蛋白质组的理解加倍,并揭示了其他20个具有生物学意义的生物体中的蛋白质结构,从大肠杆菌到酵母,从果蝇到小鼠。

这将是自人类基因组测序以来最重要的数据集之一。Ewan Birney,EMBL副总干事和EMBL-EBI主任

作为支持研究人员工作的强大工具,我们认为这是人工智能迄今为止对推动科学知识做出的最重要贡献,并且是人工智能为人类带来好处的绝佳范例。这些洞察将为我们对生物学和医学的理解带来许多令人兴奋的未来进展。多亏了AlphaFold团队五年的不懈努力和巧妙设计,并在过去几个月与我们在EMBL的欧洲生物信息学研究所(EMBL-EBI)的合作伙伴密切合作,我们能够与全世界分享这一庞大宝贵的资源。

上一页 下一页:

这项最新工作是在去年12月我们在CASP14会议上发布的公告的基础上进行的,当时DeepMind首次推出了我们的AlphaFold系统的一个全新版本,被评估组织认定为解决了50年来理解蛋白质三维结构的重大挑战。实验性确定蛋白质结构是一项耗时费力的工作,但AlphaFold证明了人工智能可以准确预测蛋白质的结构,规模化和分钟级的预测精度可达到原子级。在CASP上,我们承诺分享我们的方法并广泛提供对这一知识体系的访问。

在自由建模类别中,每个CASP中最佳团队的预测中位数准确度的改进,以最佳5个GDT测量

这个月,我们完成了大量辛勤工作,履行了这一承诺。我们在《自然》杂志上发表了两篇同行评议的论文(1, 2),并开源了AlphaFold的代码。今天,与EMBL-EBI合作,我们非常自豪地推出了AlphaFold蛋白质结构数据库,这是迄今为止对人类蛋白质组提供最完整和准确的描述,使人类高精度蛋白质结构的知识翻了一番多。

除了人类蛋白质组(由人类基因组表达的所有约20,000种蛋白质)外,我们还提供对其他20个具有生物学意义的生物体的蛋白质组的开放访问,总共有超过350,000个蛋白质结构。对这些生物体的研究已成为无数研究论文和许多重大突破的主题,并导致对生命本质的更深入理解。在未来几个月中,我们计划大幅扩展覆盖范围,几乎涵盖科学所知的所有蛋白质序列-超过1亿个结构,涵盖了大部分UniProt参考数据库。这是一个真正的世界蛋白质年鉴。随着我们不断投资于AlphaFold的未来改进,系统和数据库将定期更新。

最令人兴奋的是,在全球科学家的手中,这本新的蛋白质年鉴将促进并加速研究,推动我们对这些生命基石的理解。通过我们早期的合作,我们已经看到科研人员在他们自己的工作中使用AlphaFold取得了有希望的结果。例如,忽视疾病倡议(DNDi)已推进了对影响世界贫困地区的疾病的搭救性治疗方法的研究,而朴茨茅斯大学酶创新中心(CEI)正在使用AlphaFold帮助设计更快的酶以回收一些污染环境最严重的一次性塑料。对于那些依赖实验性蛋白质结构确定的科学家来说,AlphaFold的预测帮助加速了他们的研究。另一个例子是科罗拉多大学博尔德分校的一个团队正在使用AlphaFold预测研究抗生素耐药性的潜力,而加州大学旧金山分校的一个团队则利用它们增加了对SARS-CoV-2生物学的理解。而这只是我们希望在结构生物信息学中引发革命的开始。有了AlphaFold在世界上的应用,现在有大量的数据等待着被转化为未来的进展。

AlphaFold开辟了新的研究领域,令人鼓舞的是,强大的尖端人工智能使得对贫困人口集中患病的疾病的研究成为可能。 – Ben Perry,发现开放创新领袖,被忽视的疾病倡议(DNDi)

对DeepMind的AlphaFold团队来说,这项工作代表了五年的巨大努力的结晶,其中包括创造性地克服了许多困难和挫折,从而产生了一系列新的复杂算法创新,这些创新都是必要的,才能最终解决问题。它建立在几代科学家的发现基础上,从早期蛋白质成像和晶体学的先驱者,到数千名预测专家和结构生物学家,他们花了多年时间研究蛋白质。我们的梦想是,通过提供这种基础性的理解,AlphaFold将帮助更多科学家在他们的工作中,并开辟全新的科学发现途径。

AlphaFold只用了一个周末就完成了我们几个月甚至几年才能完成的工作。 ‍ – 约翰·麦基汉教授,结构生物学教授,朴茨茅斯大学酶创新中心(CEI)主任

在DeepMind,我们的理念一直是人工智能可以极大地加速科学领域的突破,并推动人类进步。我们建立了AlphaFold和AlphaFold蛋白质结构数据库,以支持和提升世界各地科学家在他们重要工作中的努力。我们相信人工智能有潜力在21世纪改变科学的做法,我们迫切期待AlphaFold可能帮助科学界解锁的新发现。

要了解更多信息,请访问《自然》杂志,阅读我们的同行评议论文,描述了我们的完整方法和人类蛋白质组。您也可以在我们的技术博客上了解更多。如果您想探索我们的系统,这里是AlphaFold的开源代码和Colab笔记本,可用于运行单个序列。要探索我们的结构,全球生物数据领先者EMBL-EBI将其托管在一个可搜索的数据库中,对所有人开放免费。

我们非常乐意听取您的反馈,了解AlphaFold对您的研究有何帮助。请将您的故事分享至alphafold@deepmind.com。

Leave a Reply

Your email address will not be published. Required fields are marked *