扩散模型最近在人工智能领域取得了很大的成功和关注。作为生成模型的一员,这些模型可以有效地逆转将数据转化为噪声的扩散过程,使它们能够理解复杂的数据分布。这种方法在许多生成任务中取得了突破,特别是在生成高质量图像方面,它已经超越了传统的基于GAN技术的方法。现代的文本到图像生成AI系统的发展得益于这些扩散模型的进展。
扩散模型在某些领域表现出色,但在其他领域表现不佳。在图片翻译等应用中,将它们应用起来可能比较困难,因为其假设存在一个预先存在的随机噪声分布。通常会使用一些复杂的方法,如训练模型或手动调整样本的方法来解决这个问题。这些技术在理论上支持不足,并且经常只支持单向映射,通常是从损坏的图片到清晰的图片,放弃了循环一致性的想法。
与传统的扩散模型范例相比,一组研究人员引入了一种新颖和独特的策略,称为去噪扩散桥模型(DDBMs)。扩散桥是一类平滑插值两个指定为端点的配对分布的过程,DDBMs利用了这个思想。DDBMs直接从数据中得出扩散桥的得分,而不是从随机噪声开始。然后,学习到的得分指导模型,使其通过解随机微分方程从一个端点分布映射到另一个端点分布。
DDBMs的一个主要优势是能够自动组合几种生成模型的能力。它们可以轻松地组合OT-Flow-Matching和基于得分的扩散模型的组件,以适应当前的设计决策和架构策略,以应对更一般的挑战。
该团队已将DDBMs应用于困难图片数据集的实证分析中,同时考虑像素级模型和潜空间模型。在常见的图片翻译任务中,DDBMs远远优于基线方法,展示了它们在应对具有挑战性的图像改变任务方面的适用性。当该团队简化问题,假设源分布为随机噪声时,DDBMs产生与用于图像生成的最先进技术竞争的结果,由FID得分进行评估。
这显示了DDBMs在各种生成任务中的适应性和可靠性,即使它们并不是针对特定情况而设计的。总而言之,扩散模型在各种生成任务中发挥了作用,但在图片翻译等工作中存在缺点。建议的DDBMs提供了一种创新和可扩展的解决方案,将基于扩散的生成和分布翻译方法整合在一起,提高了处理具有挑战性的与图像相关任务的性能和灵活性。