你是否曾经想过人们如何使用AI图像生成生成如此逼真的面孔,而你自己的尝试却充满了错误和瑕疵,使它们看起来明显是假的?你尝试过调整提示和设置,但仍然无法达到你看到其他人制作的质量。你做错了什么?
在这篇博文中,我将向你介绍使用稳定扩散(Stable Diffusion)开始生成超逼真人脸的3个关键技巧。首先,我们将介绍提示工程的基本原理,以帮助你使用基本模型生成图像。接下来,我们将探索升级到稳定扩散XL模型如何通过更大的参数和训练显著提高图像质量。最后,我将向你介绍一种专门用于生成高质量肖像的自定义模型。
1. 提示工程
首先,我们将学习如何写出积极和消极的提示来生成逼真的面孔。我们将使用Hugging Face Spaces上提供的稳定扩散2.1版本演示。它是免费的,你可以直接开始,无需进行任何设置。
链接:hf.co/spaces/stabilityai/stable-diffusion
当创建一个积极的提示时,确保包含所有必要的细节和图像风格。在这种情况下,我们想生成一个年轻女子在街上行走的图像。我们将使用一个通用的消极提示,但你可以添加额外的关键词,避免图像中出现重复的错误。
积极提示:“一个年轻的二十几岁的女子,在街上行走,直接看着相机,自信友好的表情,休闲穿着现代时尚的服装,城市街景背景,明亮的阳光照射,色彩鲜艳”
消极提示:“残疾,丑陋,坏,不成熟,卡通,动漫,3D,绘画,黑白,卡通,绘画,插图,最差的质量,低质量”
我们有了一个良好的开端。图像是准确的,但图像质量可以更好。你可以尝试调整提示,但这是基本模型的最佳结果。
2. 稳定扩散XL
我们将使用稳定扩散XL(SDXL)模型生成高质量的图像。它通过使用基本模型生成潜在信息,然后通过细调器处理来生成详细和准确的图像。
链接:hf.co/spaces/hysts/SD-XL
在生成图像之前,我们将向下滚动并打开“高级选项”。我们将添加一个消极提示,设置种子,并应用细调器以获得最佳图像质量。
然后,我们将写下与之前相同的提示,进行小的改变。我们将生成一个年轻的印度女性的图像。
这是一个改进的结果。面部特征完美。让我们尝试生成其他种族的图像,以检查是否存在偏见并进行比较。
我们得到了逼真的面孔,但所有图像都有Instagram滤镜。通常,真实生活中皮肤并不如此光滑。它有痘痘、痕迹、雀斑和纹路。
3. CivitAI: RealVisXL V2.0
在本部分中,我们将生成带有标记和逼真皮肤的详细面部图像。为此,我们将使用 CivitAI 的定制模型(RealVisXL V2.0),该模型经过优化,用于生成高质量肖像。
链接:civitai.com/models/139562/realvisxl-v20
您可以通过点击“创建”按钮在线使用该模型,也可以通过 Stable Diffusion WebUI 下载并在本地使用。
首先,下载模型并将文件移动到 Stable Diffusion WebUI 模型目录:C:\WebUI\webui\models\Stable-diffusion。
要在 WebUI 上显示模型,您需要按下刷新按钮,然后选择“realvisxl20…” 模型检查点。
我们将从编写相同的正面和负面提示开始,并生成高质量的 1024X1024 图像。
图像看起来完美。要充分利用定制模型,我们必须更改提示。
新的正面和负面提示可通过在模型页面向下滚动并点击您喜欢的逼真图像来获得。CivitAI 上的图像配有正面和负面提示以及高级的转向技术。
正面提示:“一张印度年轻女性的图像,专注、果断、超现实、动态姿势、超高分辨率、锐度纹理、高细节原始照片、详细面部、浅景深、锐利双眼,(逼真皮肤纹理:1.2),浅色皮肤、单反相机、胶片颗粒”
负面提示:“(最差质量、低质量、插图、3D、2D、绘画、卡通、素描),张嘴”
我们有一张带有逼真皮肤的印度女性详细图像。与基础 SDXL 模型相比,这是一个改进版本。
我们生成了三张不同族裔的图像进行比较。结果令人惊喜,包含了皮肤瑕疵、多孔皮肤和准确的特征。
结论
生成艺术的进步很快将达到一个水平,我们将难以区分真实图像和合成图像。这预示着一个可持续的未来,在这个未来,任何人都可以通过利用在多样的真实数据上训练的定制模型,从简单的文本提示中创建高度真实的媒体。快速的进展意味着令人兴奋的潜力 – 也许有一天,生成一个复制您自己形象和语音模式的逼真视频可能就像输入一个描述性提示一样简单。
在本文中,我们了解了提示工程、先进的 Stable 设计模型以及针对生成高度准确和逼真面部的定制模型。如果您想要更好的结果,我建议您探索 civitai.com 上提供的各种高质量模型。
****[Abid Ali Awan](https://www.polywork.com/kingabzpro)****(@1abidaliawan)是一位拥有认证数据科学家资格的专业人士,他热衷于构建机器学习模型。目前,他专注于内容创作,并撰写关于机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是利用图神经网络为心理疾病患有困扰的学生构建一个 AI 产品。