易于应用集成的前五种稳定扩散API

介绍

在人工智能时代，API是解决企业面临的重要挑战之一，即将AI模型整合到软件和应用中时的高计算要求的一种解决方案。这种解决方案被称为应用程序编程接口（API）。API可以帮助你摆脱维护的麻烦，让你专注于业务逻辑和用户体验。这意味着任何人都可以利用这些API构建和商业化应用。本文将探讨稳定扩散API，这是一组专注于图像生成的生成式AI模型，这些模型对于各种应用程序至关重要。

我们首先将看到Segmind API，这是一个非常高效和有效的选择。这些API已经彻底改变了开发人员、设计师和创作者处理视觉内容生成的方式。我们将探索一些排名前五的稳定扩散API，重点介绍它们的特点、用途、定价等等。

学习目标

深入了解稳定扩散模型。
了解稳定扩散模型的基础知识，包括它们的应用。
了解现代软件开发中的API。
探索API在简化软件和应用开发中的关键作用。

本文是数据科学博文马拉松的一部分。

了解稳定扩散模型

什么是稳定扩散模型？

稳定扩散模型是一类专注于生成高质量图像的生成式AI模型。这些模型旨在生成具有各种应用的逼真、高分辨率图像。它们的特点是稳定和可靠，对于图像合成、风格转移和数据增强等任务非常有帮助。

易于应用集成的前五种稳定扩散API 四海第1张

稳定扩散模型使用扩散过程生成图像，从而逐渐向图像添加噪声，直到演化为复杂而连贯的输出。这个过程确保生成的图像具有高质量并展现出细节。

什么是API？

API，或应用程序编程接口，是一组规则和协议，允许一个软件应用程序与另一个应用程序、服务或平台的功能或数据进行交互。API是中介，实现软件之间的集成。

在软件开发中，API为开发人员提供了一种访问功能、服务或数据的方式，包括云服务、数据库或AI模型等源，而无需理解底层复杂性。这简化了开发过程，加速了功能丰富应用的创建。

易于应用集成的前五种稳定扩散API 四海第2张

API可以采用多种形式，包括RESTful API、gRPC API和WebSocket API，每种都针对特定的用例。在现代软件中，它们发挥着关键作用，使开发人员能够利用第三方服务和功能的强大能力，同时专注于核心应用程序逻辑。

前五稳定扩散API

让我们来看看我们列表上排名靠前的稳定扩散API，首先是用户友好的Segmind API。

1. Segmind稳定扩散API

首先是Segmind API，以其易用性和简单设置而闻名。如果你有使用Postman等标准API工具的经验，你几乎不需要学习任何新的东西。我们将简要介绍如何做到这一点。你可以参考这篇文章https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/以了解如何使用Segmind和Postman的详细方法。

Segmind的GenAI API提供多种用途、功能和优势。其中一些包括电子商务、时尚、建筑（如DvArch）、动画、背景移除等方面的图像识别。Segmind的AI模型可以通过API和网站上的playground获取，网址是https://www.segmind.com/models。

为什么选择Segmind API？

有很多原因使Segmind成为我们的首选。

速度： Segmind提供开发人员访问最快速的Serverless Stable Diffusion APIs。
价格实惠： Segmind的优化帮助您获得最具成本效益的推理，按API调用付费。
使用便捷： 使用一键无缝API集成并轻松扩展其高性能API。
可扩展： Segmind会自动扩展以处理需求。您只需要支付API调用费用。

使用Segmind API Playground进行演示

API playground使得在几秒钟内使用模型变得非常容易。为了演示API playground的易用性，我们将考虑名为“Dreamshaper SDXL”的新型稳定扩散模型。您只需要一个帐户，可以在几分钟内设置。访问 https://www.segmind.com/ 进行注册。注册后，进入模型页面并搜索“Dreamshaper SDXL”，一个新的版本。或者按照此链接 https://www.segmind.com/models/sdxl1.0-dreamshaper。点击模型后，您会看到playground。此外，您还可以通过屏幕截图了解API调用界面，如下所示。

易于应用集成的前五种稳定扩散API 四海第3张

要尝试上面的图像，这是我使用的提示：

揭示一个电影肖像：满腔怒火的猫1.25穿着太空服，望着无尽的悲伤宇宙，赛博朋克2077城市背景，约翰·威廉姆（John Wilhelm）创作的二维杰作，满腔怒火1.2、赛博朋克1.4、逼真的照片、八达通渲染、HDR、荧光、镜头光晕、最佳质量1.9、活跃的非对称姿势、充满动感的1.8、在ArtStation上流行的8K、35mm照片、电影、浅景深、专业、4K、高度详细。

上述方法是使用直接在网站上提供的playground。可用的另一种选择是API。这是Segmind的一个强大选项。在这里，您可以使用API调用构建您的应用程序并享受Segmind模型。

易于应用集成的前五种稳定扩散API 四海第4张

使用Segmind API调用

API调用消除了托管这些庞大且昂贵的模型的需要。您不需要关心服务器维护或托管。您需要具备使用Postman等API功能的基本知识。整个过程与常规API调用相同。假设您在您的Web应用程序中使用Javascript，下面是用于对Dreamshaper SDXL进行POST请求的脚本。这将返回一个jpeg图像。

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Request payloaddata = {  "prompt": "cinematic photo of portrait of cyberpunk (the Grumpy Cat:1.25) in a spacesuit, looking with endless sadness at the universe passing by, cyberpunk 2077 city bg,  2d masterpiece by john Wilhelm, (grumpy:1.2), (cyberpunk:1.4), photo-realistic, octane render, hdr, neon, lens flares, ( best quality:1.9), active asymmetrical pose, (action-packed:1.8),  trending on artstation, 8k, 35mm photograph, film, bokeh, professional, 4k, highly detailed",  "negative_prompt": "drawing, painting, crayon, sketch, graphite, impressionist, noisy, blurry, soft, deformed, ugly, [deformed | disfigured], poorly drawn, [bad : wrong] anatomy, [extra | missing | floating | disconnected] limb, (mutated hands and fingers), blurry",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmind为每个模型在其页面上制作了单独的API调用脚本，以便于使用和访问。您只需要从Postman进行POST请求。假设您使用Python进行开发，可以使用以下Python脚本：

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# 请求载荷数据= {"prompt": "电影照片，描述了一个穿着太空服的赛博朋克肖像（Grumpy Cat：1.25），他无尽的悲伤凝视着经过的宇宙，赛博朋克2077城市背景，由John Wilhelm创作的2D杰作，带有皮秒渲染器，高动态范围（HDR），霓虹灯，光晕，（最佳质量：1.9），上升式非对称姿势，（动作包：1.8），在ArtStation上趋势，8K，35mm照片，电影，浅景深，职业，4K，高度详细", "negative_prompt": "绘画，绘画，蜡笔，素描，石墨，印象派，嘈杂，模糊，柔和，变形，丑陋，【变形| 残缺】，画得差，[多余| 缺失| 悬浮| 断开]的肢体，（变异的手和手指），模糊", "样本": 1, "调度器": "UniPC", "推理步骤数": 35, "引导比例": "7", "种子": "1135424276", "图像宽度": "1024", "图像高度": "1024", "base64": False}response = requests.post(url, json = data, headers = {'x-api-key': api_key})print(response)

您只需要修改数据中的提示，您收到的响应即为生成的图像（jpeg格式）。您可以进一步探索或参考此文章https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/以获取有关在Postman中使用Segmind的详细步骤，或者访问文档或GitHub存储库以获取更多信息。链接将在文章末尾汇总。接下来，我们将简要介绍其他SD API提供商。

2. Stability AI API-开源生成式AI

Stability AI是开源生成式人工智能领域的领导者，致力于推进基础设施和研究。他们的开源理念支持语言、代码、音频、视频、3D内容、设计和生物技术。这旨在赋予人类AI的潜力。

Stability AI API提供了灵活的身份验证、积分和API调用方式。用户必须创建一个帐户以获得API密钥，这对于访问API是必需的。使用Stability API需要积分，新用户在注册时将获得25个免费积分。

使用API调用

Stability AI对于新手来说有些复杂，因为它提供了多种类型的API。除了常规的REST，它们还提供了gRPC API。您可以在GitHub上查看一些技术指南。您可以查看文档，文档中提供了所有的API调用方式，但是进行文本到图像生成，结构如下所示（使用Python语言）。

import base64import osimport requestsengine_id = "stable-diffusion-xl-1024-v1-0"api_host = os.getenv('API_HOST', 'https://api.stability.ai')api_key = os.getenv("STABILITY_API_KEY")if api_key is None:    raise Exception("缺少Stability API密钥。")response = requests.post(    f"{api_host}/v1/generation/{engine_id}/text-to-image",    headers={        "Content-Type": "application/json",        "Accept": "application/json",        "Authorization": f"Bearer {api_key}"    },    json={        "text_prompts": [            {                "text": "悬崖上的灯塔"            }        ],        "cfg_scale": 7,        "height": 1024,        "width": 1024,        "samples": 1,        "steps": 30,    },)if response.status_code != 200:    raise Exception("非200响应：" + str(response.text))data = response.json()for i, image in enumerate(data["artifacts"]):    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:        f.write(base64.b64decode(image["base64"]))

对于使用其他语言的开发人员，有适用于Typescript和Go的脚本。您可以查看其文档以获取详细信息。现在让我们来看看下一个API。

3. Hotpot.ai 稳定扩散API-量身定制

Hotpot.ai的稳定扩散API是另一个提供多种选择以满足不同需求的API。它采用了专有优化，面向企业和消费者，提供了一种可定制的稳定扩散模型，具有成本效益。它们允许您生成图像而无需注册。我们将使用它们的AI艺术生成器，使用前一个提示的第一句话生成一幅图像。

提示：

创建一幅将赛博朋克和未来太空探索元素融合在一起的艺术品。

易于应用集成的前五种稳定扩散API 四海第5张

我们可以通过“Style”参数轻松调整图像。切换到不同的样式会得到以下图像。

易于应用集成的前五种稳定扩散API 四海第6张

定价：API的定价取决于月度使用量、订阅计划和共同营销折扣等因素。请谨慎对待那些提供无限套餐的交易，因为它们可能会影响可靠性和延迟。Hotpot.ai确保可扩展性，管理数百万个图像生成请求，同时保持低延迟和高可靠性。

接入API：使用Stable Diffusion在线编辑器可以轻松访问API，其结果与API完全相同。关键区别在于速度，API用户可以访问专用、更强大的服务器，以实现更快的图像生成。Hotpot.ai甚至为其稳定扩散API提供免费的测试积分，使开发人员可以使用。

此外，Hotpot.ai与最新的稳定扩散版本保持同步，目前提供2.1版本，并计划集成稳定扩散XL以供商业用途。

让我们来看看Hotpot的API调用脚本。Hotpot.ai提供了Stable Diffusion API，分为预算、标准和高级。要使用Python调用API，您首先需要安装’request’。

!pip3 install requestsimport requestsheaders = {  'Authorization': 'API_KEY_HERE',}# 将文件路径更改为您要转换的图像的完整文件路径body = {  'image': open('/full/path/to/image.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# 将文件路径更改为您要保存结果图像的完整文件路径with open('/full/path/to/image-nobg.jpg', 'wb') as file:  file.write(response.content)

是的，即使您使用古老而经典的PHP，也没有被忽视。

<?php$ch = curl_init();// 将文件路径更改为您要转换的图像的完整文件路径$body = [  'image' => new CurlFile('/full/path/to/image.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_HERE');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// 将文件路径更改为您要保存结果图像的完整文件路径file_put_contents('/full/path/to/image-nobg.jpg', $response);

如果您需要更多相关信息，请访问GitHub。

4. ZYLA稳定扩散API-重新定义图像生成

ZYLA稳定扩散API利用最先进的稳定扩散v2.1模型生成高质量的图像。该API提供了先进的图像生成功能、可扩展性和用户友好的界面。开发人员、设计师和内容创作者可以通过惊人而逼真的图像增强其项目。Zyla就像是API的商店。我们将仅关注稳定扩散API。

易于应用集成的前五种稳定扩散API 四海第7张

Zyla SD API 的显著用例

平面设计与广告：创建网站、社交媒体和印刷广告中引人注目的图形的理想选择。

虚拟现实与增强现实：增强虚拟现实和增强现实应用中的视觉细腻度。

内容创建与媒体制作：帮助电影制片人、游戏开发人员和动画工作室制作引人入胜的内容。

电子商务与产品可视化：通过逼真的产品图像提升购物体验。

艺术探索与创意表达：激发创意和艺术探索。

图像编辑与增强：为图像编辑提供先进工具。

大部分 API 都有免费 7 天试用期。您可以注册并查看是否符合您的需求。

用于 AI 图像生成 API 的 Postman API 支持 Segmind AI。注册后，您将获得个人 API 访问密钥。只需在 Authorization 头部中使用您的 bearer token 进行身份验证即可使用 AI 图像生成 API REST API。在 Postman 中，头部变量如下：

Authorization

您需要注册以访问该 API。注册后，查看“您的 API 访问密钥”并设置[必填]为 Bearer access_key。

Bearer access_key

请注意，ZYLA 更像是一个 API 的网络商店，SD API 只是其中的一个集合。

5. Getimg.ai API

此 API 可让您使用最新的 Stable Diffusion 模型生成和编辑图像。您可以将此 API 用于图像生成管道，如文本转图像、ControlNet、修复、放大等。

易于应用集成的前五种稳定扩散API 四海第8张

他们的编码非常简洁。以下是使用 cURL 向 Stable Diffusion API 进行文本转图像生成的 POST 请求示例：

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"a photo of an astronaut riding a horse on Mars"}'

您可以在 playground 中使用上面的提示来体验该模型。下面的示例一次生成 4 张图像，这对生成库存照片非常方便。

易于应用集成的前五种稳定扩散API 四海第9张

易于应用集成的前五种稳定扩散API 四海第10张

易于应用集成的前五种稳定扩散API 四海第11张

易于应用集成的前五种稳定扩散API 四海第12张

易于应用集成的前五种稳定扩散API 四海第13张

您可以根据需求自定义提示以生成不同的图像。

此外，getimg.ai 根据您选择的大小、步骤和管道提供不同的定价选项。例如，Stable Diffusion XL，大小为 1024×1024 像素，步骤为 30，价格为每张图像 0.00944 美元。

您可以在getimg.ai网站上找到有关该API的更多信息、用例和定价，您可以探索他们提供的图像生成和编辑功能和模型。您必须注册并获取API密钥，以验证您对API的请求。

结论

图像生成正在快速发展，稳定扩散API处于前沿。开发人员、设计师和内容创作者现在有着丰富的选择。这些API提供高级功能、可扩展性和多种用例，使它们成为现代人工智能领域中不可或缺的工具。利用这些API来改变您的项目，并享受尖端图像生成技术的力量。

关键要点

稳定扩散API提供了一种无缝的AI开发方法，使开发人员可以专注于构建AI产品，而将GPU维护交给服务提供商。
许多稳定扩散API通过稳定扩散在线编辑器等工具提供用户友好的访问方式，提供与其API相同的结果，但速度更快。
稳定AI API采用开源理念，为开发人员提供对多个领域的尖端AI技术的开放访问权限。

常见问题

参考链接

https://www.segmind.com/
https://www.segmind.com/models
https://www.segmind.com/models/sdxl1.0-dreamshaper
https://platform.stability.ai/docs/getting-started
https://platform.stability.ai/docs/api-reference
https://hotpot.ai/stable-diffusion-api
https://hotpot.ai/art-generator?s=stable-diffusion-api
https://zylalabs.com/api-marketplace/tag/stable+diffusion
https://stablediffusionapi.com/
https://getimg.ai/tools/api

此文章中的媒体不属于Analytics Vidhya，而是根据作者的决定使用。