Press "Enter" to skip to content

斯坦福研究人员推出Protpardelle:一种突破性的全原子扩散模型,用于蛋白质结构和序列的共同设计

斯坦福研究人员推出Protpardelle:一种突破性的全原子扩散模型,用于蛋白质结构和序列的共同设计 四海 第1张斯坦福研究人员推出Protpardelle:一种突破性的全原子扩散模型,用于蛋白质结构和序列的共同设计 四海 第2张

在蛋白质设计方面取得了令人瞩目的进展,一支研究团队揭示了全原子扩散模型Protpardelle,该模型解决了连续和离散蛋白质结构之间复杂的相互作用。该模型通过生成具有卓越质量、多样性和新颖性的蛋白质,突破了该领域的传统界限。

蛋白质是生物功能的关键,通过精确的化学相互作用协调各种重要过程。挑战在于准确地建模这些主要由侧链控制的相互作用,以实现有效的蛋白质设计。Protpardelle利用一种独特的“叠加”技术,涵盖了各种潜在的侧链状态,随后将它们折叠起来启动逆扩散进行样本生成。

通过与序列设计方法的协同作用,Protpardelle开创了全原子蛋白质结构和序列的共同设计。生成的蛋白质表现出卓越的质量,通过广泛接受的度量标准评估自洽性。这个度量标准预测设计序列的结构构象,并测量预测结构与采样结构之间的一致性。Protpardelle在长度不超过300个残基的蛋白质上始终保持着超过90%的成功率,与现有方法相比,在设计性方面取得了显著的进步。此外,它以大幅降低的计算成本实现了这一成就,突显了其高效性。

多样性是生成模型的一个关键特征,它能够防止模式崩溃并拓宽可行解的范围。Protpardelle在这方面表现出色,将样本聚类以揭示丰富的结构多样性。它在生成具有广泛的α型和β型结构的蛋白质方面具有出色的能力,证明了其多功能性。

重要的是,Protpardelle不受训练数据集的约束。它展示了锻造与训练集中不同的新型蛋白质的出色能力。这意味着它有潜力通过进入未知领域来改变蛋白质工程的方式。

Protpardelle的全原子模型在无条件蛋白质生成方面展示了其卓越能力,尤其在长度不超过150个残基的蛋白质方面表现出色。在结构相似性度量标准的评估下,它达到了约60%的成功率。对样本的视觉检查显示了多样的蛋白质折叠方式,丰富地装饰有二级结构元素。

Protpardelle精确地保持了生成样本的化学完整性,与天然蛋白质中观察到的键长和键角分布一致。该模型巧妙地捕捉了天然分布的主要chi角模式,提供了侧链行为的全面描述。

团队的网络架构是Protpardelle非凡能力的基础,它采用了具有策略性设计层和注意力头的U-ViT结构。噪声调节在训练过程中注入了关键信息。该模型在CATH S40数据集上进行了精心训练,证明了其基础的鲁棒性。

Protpardelle的独特去噪步骤是其采样过程的关键要素,进一步巩固了其尖端方法。这种改进的算法能够熟练地应对蛋白质生成过程的复杂性,优化参数以获得最佳结果。

Protpardelle的引入标志着蛋白质设计的范式转变,为生物技术和制药开启了前所未有的可能性。它将结构和序列无缝地融合在一起,有潜力在该领域开创新时代。随着研究人员继续探索其无限的能力,Protpardelle注定将重塑蛋白质设计和工程的领域。

Leave a Reply

Your email address will not be published. Required fields are marked *