混沌中塑造艺术：扩散模型 – SMLDs

想象力创造现实…

在之前的文章中，我们介绍了扩散模型的一般结构以及一个非常流行的类别，去噪扩散概率模型 (DDPMs)。现在，我们将看看完全不同但等效的构建扩散过程的方法。这个类别中的模型被称为 SMLDs，即 Score Matching via Langevin Dynamics，这个名字后面会更清楚。

让我们开始我们的旅程吧!

在这些模型的核心是概率密度 p(x) 的 (Stein) 分数函数 ∇ₓlogp(x)。

这个量提供了我们从一个随机样本 x₀ 移动到一个具有高密度区域的样本 xₙ 的方向。用于此过程的算法称为 Langevin 采样算法。

就像 DDPMs 受到热力学的启发一样，SMLDs 的基本概念可以追溯到物理学。特别是，Langevin 采样，在物理学中称为 Langevin 动力学，是一种数学建模分子系统动力学的方法，最初由法国物理学家 Paul Langevin 开发。

但说了这么多，现在让我们来看看这个美妙想法背后的实际数学！

关于这类扩散模型的理论基础在开创性论文“通过估计数据分布的梯度进行生成建模”中确立。根据 Langevin 采样算法，我们得到以下迭代过程：

其中：

zₜ∼ N (0, I)，ε > 0 且 x₀∼ p(x₀)（先验分布）。

在数学上，这被称为 Langevin Markov Chain Monte Carlo (MCMC)。这个过程允许仅使用分数函数从概率分布 p(x) 进行采样。