DDPM、稳定扩散、DALL·E-2、Imagen、Kandinsky 2、SDEdit、ControlNet、InstructPix2Pix 等
目录
- 介绍
- 先决条件和建议的材料
- 扩散器流水线
- 流水线:DDPM(扩散模型)
- 流水线:稳定扩散文本到图像
- 流水线:稳定扩散图像到图像(SDEdit)
- 流水线:稳定扩散图像变化
- 流水线:稳定扩散放大
- 流水线:稳定扩散潜变量放大
- 流水线:unCLIP(Karlo/DALL·E-2)
- 流水线:DeepFloyd IF(Imagen)
- 流水线:Kandinsky
- 流水线:ControlNet
- 流水线:Instruct Pix2Pix
- 附录 — CLIP
- 附录 — VQGAN
- 附录 — Prompt-to-Prompt
- 结论
- 致谢
介绍
随着对生成式人工智能的日益浓厚兴趣,包括图像生成,越来越多的优秀资源开始变得可用,我将在下面列举其中一些。然而,根据我的经验,进一步学习基础课程需要付出很大的努力,因为高级主题的资源变得更加分散。
在本文中,我们将列出 Hugging Face Diffusers 库中最受欢迎的扩散模型,这是利用这一技术的主要工具。我们将对这些模型进行简要解释,进行比较,并概述它们的优势和劣势。
本文的结构如下:我们将首先回顾一些对于初学扩散模型的人而言有价值的资源。之后,我们将简要解释 HuggingFace 流水线。最后,我们将深入研究 Diffusers GitHub 仓库中的 Popular Tasks & Pipelines 部分中列出的每个流水线。