而且他们不得不创建新的工具来处理如此大量的蛋白质结构模型
DeepMind的AlphaFold 2与欧洲生物信息研究所合作,最近发布了超过2亿个预测的蛋白质结构,开启了蛋白质研究的新时代。在这里,我将介绍两篇发表在《自然》杂志上的开创性论文的发现摘要,深入探讨了这个蛋白质宇宙的深度。这些论文采用创新的聚类算法、结构比较和其他对现有工具的改进,以处理大数据量,揭示了前所未有的规模上的蛋白质结构多样性、进化关系和功能潜力。
蛋白质是生物学的工作马,控制着从能量生成到细胞分裂的各种细胞过程。虽然蛋白质的测序在多年来得到了飞速发展,这要归功于基因组学的进步,但由于缺乏可扩展的实验方法,蛋白质的三维结构的确定一直滞后。然而,随着DeepMind开发的具有突破性的人工智能系统AlphaFold 2的出现,蛋白质结构预测的领域发生了变革。AlphaFold蛋白质结构数据库(AFDB)现在拥有惊人的2亿个预测的蛋白质结构,标志着计算生物学的一个里程碑。
基于AlphaFold的数据库和完善的易于使用的在线AlphaFold界面即将…
不仅仅是计算生物学,还有实验生物学。对生物学中数据科学领域的未来的思考。
towardsdatascience.com
实际上,就在本周,有两组作者在《自然》杂志上发表了文章,报告了如何利用AlphaFold 2的蛋白质模型来揭示蛋白质宇宙中的新见解。这些研究利用现有工具的创新版本,适应了AFDB中的大量数据;例如,现代化的聚类算法和结构比较方法。通过这些改进的工具,这些研究探索了蛋白质结构的广阔领域,它们的进化起源和功能影响。