Press "Enter" to skip to content

易于应用集成的前五种稳定扩散API

介绍

在人工智能时代,API是解决企业面临的重要挑战之一,即将AI模型整合到软件和应用中时的高计算要求的一种解决方案。这种解决方案被称为应用程序编程接口(API)。API可以帮助你摆脱维护的麻烦,让你专注于业务逻辑和用户体验。这意味着任何人都可以利用这些API构建和商业化应用。本文将探讨稳定扩散API,这是一组专注于图像生成的生成式AI模型,这些模型对于各种应用程序至关重要。

我们首先将看到Segmind API,这是一个非常高效和有效的选择。这些API已经彻底改变了开发人员、设计师和创作者处理视觉内容生成的方式。我们将探索一些排名前五的稳定扩散API,重点介绍它们的特点、用途、定价等等。

学习目标

  • 深入了解稳定扩散模型。
  • 了解稳定扩散模型的基础知识,包括它们的应用。
  • 了解现代软件开发中的API。
  • 探索API在简化软件和应用开发中的关键作用。

本文是数据科学博文马拉松的一部分。

了解稳定扩散模型

什么是稳定扩散模型?

稳定扩散模型是一类专注于生成高质量图像的生成式AI模型。这些模型旨在生成具有各种应用的逼真、高分辨率图像。它们的特点是稳定和可靠,对于图像合成、风格转移和数据增强等任务非常有帮助。

易于应用集成的前五种稳定扩散API 四海 第1张

稳定扩散模型使用扩散过程生成图像,从而逐渐向图像添加噪声,直到演化为复杂而连贯的输出。这个过程确保生成的图像具有高质量并展现出细节。

什么是API?

API,或应用程序编程接口,是一组规则和协议,允许一个软件应用程序与另一个应用程序、服务或平台的功能或数据进行交互。API是中介,实现软件之间的集成。

在软件开发中,API为开发人员提供了一种访问功能、服务或数据的方式,包括云服务、数据库或AI模型等源,而无需理解底层复杂性。这简化了开发过程,加速了功能丰富应用的创建。

易于应用集成的前五种稳定扩散API 四海 第2张

API可以采用多种形式,包括RESTful API、gRPC API和WebSocket API,每种都针对特定的用例。在现代软件中,它们发挥着关键作用,使开发人员能够利用第三方服务和功能的强大能力,同时专注于核心应用程序逻辑。

前五稳定扩散API

让我们来看看我们列表上排名靠前的稳定扩散API,首先是用户友好的Segmind API。

1. Segmind稳定扩散API

首先是Segmind API,以其易用性和简单设置而闻名。如果你有使用Postman等标准API工具的经验,你几乎不需要学习任何新的东西。我们将简要介绍如何做到这一点。你可以参考这篇文章https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/以了解如何使用Segmind和Postman的详细方法。

Segmind的GenAI API提供多种用途、功能和优势。其中一些包括电子商务、时尚、建筑(如DvArch)、动画、背景移除等方面的图像识别。Segmind的AI模型可以通过API和网站上的playground获取,网址是https://www.segmind.com/models

为什么选择Segmind API?

有很多原因使Segmind成为我们的首选。

  • 速度: Segmind提供开发人员访问最快速的Serverless Stable Diffusion APIs。
  • 价格实惠: Segmind的优化帮助您获得最具成本效益的推理,按API调用付费。
  • 使用便捷: 使用一键无缝API集成并轻松扩展其高性能API。
  • 可扩展: Segmind会自动扩展以处理需求。您只需要支付API调用费用。

使用Segmind API Playground进行演示

API playground使得在几秒钟内使用模型变得非常容易。为了演示API playground的易用性,我们将考虑名为“Dreamshaper SDXL”的新型稳定扩散模型。您只需要一个帐户,可以在几分钟内设置。访问 https://www.segmind.com/ 进行注册。注册后,进入模型页面并搜索“Dreamshaper SDXL”,一个新的版本。或者按照此链接 https://www.segmind.com/models/sdxl1.0-dreamshaper。点击模型后,您会看到playground。此外,您还可以通过屏幕截图了解API调用界面,如下所示。

易于应用集成的前五种稳定扩散API 四海 第3张

要尝试上面的图像,这是我使用的提示:

揭示一个电影肖像:满腔怒火的猫1.25穿着太空服,望着无尽的悲伤宇宙,赛博朋克2077城市背景,约翰·威廉姆(John Wilhelm)创作的二维杰作,满腔怒火1.2、赛博朋克1.4、逼真的照片、八达通渲染、HDR、荧光、镜头光晕、最佳质量1.9、活跃的非对称姿势、充满动感的1.8、在ArtStation上流行的8K、35mm照片、电影、浅景深、专业、4K、高度详细。

上述方法是使用直接在网站上提供的playground。可用的另一种选择是API。这是Segmind的一个强大选项。在这里,您可以使用API调用构建您的应用程序并享受Segmind模型。

易于应用集成的前五种稳定扩散API 四海 第4张

使用Segmind API调用

API调用消除了托管这些庞大且昂贵的模型的需要。您不需要关心服务器维护或托管。您需要具备使用Postman等API功能的基本知识。整个过程与常规API调用相同。假设您在您的Web应用程序中使用Javascript,下面是用于对Dreamshaper SDXL进行POST请求的脚本。这将返回一个jpeg图像。

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Request payloaddata = {  "prompt": "cinematic photo of portrait of cyberpunk (the Grumpy Cat:1.25) in a spacesuit, looking with endless sadness at the universe passing by, cyberpunk 2077 city bg,  2d masterpiece by john Wilhelm, (grumpy:1.2), (cyberpunk:1.4), photo-realistic, octane render, hdr, neon, lens flares, ( best quality:1.9), active asymmetrical pose, (action-packed:1.8),  trending on artstation, 8k, 35mm photograph, film, bokeh, professional, 4k, highly detailed",  "negative_prompt": "drawing, painting, crayon, sketch, graphite, impressionist, noisy, blurry, soft, deformed, ugly, [deformed | disfigured], poorly drawn, [bad : wrong] anatomy, [extra | missing | floating | disconnected] limb, (mutated hands and fingers), blurry",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmind为每个模型在其页面上制作了单独的API调用脚本,以便于使用和访问。您只需要从Postman进行POST请求。假设您使用Python进行开发,可以使用以下Python脚本:

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# 请求载荷数据= {"prompt": "电影照片,描述了一个穿着太空服的赛博朋克肖像(Grumpy Cat:1.25),他无尽的悲伤凝视着经过的宇宙,赛博朋克2077城市背景,由John Wilhelm创作的2D杰作,带有皮秒渲染器,高动态范围(HDR),霓虹灯,光晕,(最佳质量:1.9),上升式非对称姿势,(动作包:1.8),在ArtStation上趋势,8K,35mm照片,电影,浅景深,职业,4K,高度详细", "negative_prompt": "绘画,绘画,蜡笔,素描,石墨,印象派,嘈杂,模糊,柔和,变形,丑陋,【变形| 残缺】,画得差,[多余| 缺失| 悬浮| 断开]的肢体,(变异的手和手指),模糊", "样本": 1, "调度器": "UniPC", "推理步骤数": 35, "引导比例": "7", "种子": "1135424276", "图像宽度": "1024", "图像高度": "1024", "base64": False}response = requests.post(url, json = data, headers = {'x-api-key': api_key})print(response)

您只需要修改数据中的提示,您收到的响应即为生成的图像(jpeg格式)。您可以进一步探索或参考此文章https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/以获取有关在Postman中使用Segmind的详细步骤,或者访问文档或GitHub存储库以获取更多信息。链接将在文章末尾汇总。接下来,我们将简要介绍其他SD API提供商。

2. Stability AI API-开源生成式AI

Stability AI是开源生成式人工智能领域的领导者,致力于推进基础设施和研究。他们的开源理念支持语言、代码、音频、视频、3D内容、设计和生物技术。这旨在赋予人类AI的潜力。

Stability AI API提供了灵活的身份验证、积分和API调用方式。用户必须创建一个帐户以获得API密钥,这对于访问API是必需的。使用Stability API需要积分,新用户在注册时将获得25个免费积分。

使用API调用

Stability AI对于新手来说有些复杂,因为它提供了多种类型的API。除了常规的REST,它们还提供了gRPC API。您可以在GitHub上查看一些技术指南。您可以查看文档,文档中提供了所有的API调用方式,但是进行文本到图像生成,结构如下所示(使用Python语言)。

import base64import osimport requestsengine_id = "stable-diffusion-xl-1024-v1-0"api_host = os.getenv('API_HOST', 'https://api.stability.ai')api_key = os.getenv("STABILITY_API_KEY")if api_key is None:    raise Exception("缺少Stability API密钥。")response = requests.post(    f"{api_host}/v1/generation/{engine_id}/text-to-image",    headers={        "Content-Type": "application/json",        "Accept": "application/json",        "Authorization": f"Bearer {api_key}"    },    json={        "text_prompts": [            {                "text": "悬崖上的灯塔"            }        ],        "cfg_scale": 7,        "height": 1024,        "width": 1024,        "samples": 1,        "steps": 30,    },)if response.status_code != 200:    raise Exception("非200响应:" + str(response.text))data = response.json()for i, image in enumerate(data["artifacts"]):    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:        f.write(base64.b64decode(image["base64"]))

对于使用其他语言的开发人员,有适用于Typescript和Go的脚本。您可以查看其文档以获取详细信息。现在让我们来看看下一个API。

3. Hotpot.ai 稳定扩散API-量身定制

Hotpot.ai的稳定扩散API是另一个提供多种选择以满足不同需求的API。它采用了专有优化,面向企业和消费者,提供了一种可定制的稳定扩散模型,具有成本效益。它们允许您生成图像而无需注册。我们将使用它们的AI艺术生成器,使用前一个提示的第一句话生成一幅图像。

提示:

创建一幅将赛博朋克和未来太空探索元素融合在一起的艺术品。

易于应用集成的前五种稳定扩散API 四海 第5张

我们可以通过“Style”参数轻松调整图像。切换到不同的样式会得到以下图像。

易于应用集成的前五种稳定扩散API 四海 第6张

定价:API的定价取决于月度使用量、订阅计划和共同营销折扣等因素。请谨慎对待那些提供无限套餐的交易,因为它们可能会影响可靠性和延迟。Hotpot.ai确保可扩展性,管理数百万个图像生成请求,同时保持低延迟和高可靠性。

接入API:使用Stable Diffusion在线编辑器可以轻松访问API,其结果与API完全相同。关键区别在于速度,API用户可以访问专用、更强大的服务器,以实现更快的图像生成。Hotpot.ai甚至为其稳定扩散API提供免费的测试积分,使开发人员可以使用。

此外,Hotpot.ai与最新的稳定扩散版本保持同步,目前提供2.1版本,并计划集成稳定扩散XL以供商业用途。

让我们来看看Hotpot的API调用脚本。Hotpot.ai提供了Stable Diffusion API,分为预算、标准和高级。要使用Python调用API,您首先需要安装’request’。

!pip3 install requestsimport requestsheaders = {  'Authorization': 'API_KEY_HERE',}# 将文件路径更改为您要转换的图像的完整文件路径body = {  'image': open('/full/path/to/image.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# 将文件路径更改为您要保存结果图像的完整文件路径with open('/full/path/to/image-nobg.jpg', 'wb') as file:  file.write(response.content)

是的,即使您使用古老而经典的PHP,也没有被忽视。

<?php$ch = curl_init();// 将文件路径更改为您要转换的图像的完整文件路径$body = [  'image' => new CurlFile('/full/path/to/image.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_HERE');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// 将文件路径更改为您要保存结果图像的完整文件路径file_put_contents('/full/path/to/image-nobg.jpg', $response);

如果您需要更多相关信息,请访问GitHub。

4. ZYLA稳定扩散API-重新定义图像生成

ZYLA稳定扩散API利用最先进的稳定扩散v2.1模型生成高质量的图像。该API提供了先进的图像生成功能、可扩展性和用户友好的界面。开发人员、设计师和内容创作者可以通过惊人而逼真的图像增强其项目。Zyla就像是API的商店。我们将仅关注稳定扩散API。

易于应用集成的前五种稳定扩散API 四海 第7张

Zyla SD API 的显著用例

平面设计与广告:创建网站、社交媒体和印刷广告中引人注目的图形的理想选择。

虚拟现实与增强现实:增强虚拟现实和增强现实应用中的视觉细腻度。

内容创建与媒体制作:帮助电影制片人、游戏开发人员和动画工作室制作引人入胜的内容。

电子商务与产品可视化:通过逼真的产品图像提升购物体验。

艺术探索与创意表达:激发创意和艺术探索。

图像编辑与增强:为图像编辑提供先进工具。

大部分 API 都有免费 7 天试用期。您可以注册并查看是否符合您的需求。

用于 AI 图像生成 API 的 Postman API 支持 Segmind AI。注册后,您将获得个人 API 访问密钥。只需在 Authorization 头部中使用您的 bearer token 进行身份验证即可使用 AI 图像生成 API REST API。在 Postman 中,头部变量如下:

Authorization

您需要注册以访问该 API。注册后,查看“您的 API 访问密钥”并设置[必填]为 Bearer access_key。

Bearer access_key

请注意,ZYLA 更像是一个 API 的网络商店,SD API 只是其中的一个集合。

5. Getimg.ai API

此 API 可让您使用最新的 Stable Diffusion 模型生成和编辑图像。您可以将此 API 用于图像生成管道,如文本转图像、ControlNet、修复、放大等。

易于应用集成的前五种稳定扩散API 四海 第8张

他们的编码非常简洁。以下是使用 cURL 向 Stable Diffusion API 进行文本转图像生成的 POST 请求示例:

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"a photo of an astronaut riding a horse on Mars"}'

您可以在 playground 中使用上面的提示来体验该模型。下面的示例一次生成 4 张图像,这对生成库存照片非常方便。

易于应用集成的前五种稳定扩散API 四海 第9张

易于应用集成的前五种稳定扩散API 四海 第10张

易于应用集成的前五种稳定扩散API 四海 第11张

易于应用集成的前五种稳定扩散API 四海 第12张

易于应用集成的前五种稳定扩散API 四海 第13张

您可以根据需求自定义提示以生成不同的图像。

此外,getimg.ai 根据您选择的大小、步骤和管道提供不同的定价选项。例如,Stable Diffusion XL,大小为 1024×1024 像素,步骤为 30,价格为每张图像 0.00944 美元。

您可以在getimg.ai网站上找到有关该API的更多信息、用例和定价,您可以探索他们提供的图像生成和编辑功能和模型。您必须注册并获取API密钥,以验证您对API的请求。

结论

图像生成正在快速发展,稳定扩散API处于前沿。开发人员、设计师和内容创作者现在有着丰富的选择。这些API提供高级功能、可扩展性和多种用例,使它们成为现代人工智能领域中不可或缺的工具。利用这些API来改变您的项目,并享受尖端图像生成技术的力量。

关键要点

  • 稳定扩散API提供了一种无缝的AI开发方法,使开发人员可以专注于构建AI产品,而将GPU维护交给服务提供商。
  • 许多稳定扩散API通过稳定扩散在线编辑器等工具提供用户友好的访问方式,提供与其API相同的结果,但速度更快。
  • 稳定AI API采用开源理念,为开发人员提供对多个领域的尖端AI技术的开放访问权限。

常见问题

  • https://www.segmind.com/
  • https://www.segmind.com/models
  • https://www.segmind.com/models/sdxl1.0-dreamshaper
  • https://platform.stability.ai/docs/getting-started
  • https://platform.stability.ai/docs/api-reference
  • https://hotpot.ai/stable-diffusion-api
  • https://hotpot.ai/art-generator?s=stable-diffusion-api
  • https://zylalabs.com/api-marketplace/tag/stable+diffusion
  • https://stablediffusionapi.com/
  • https://getimg.ai/tools/api

此文章中的媒体不属于Analytics Vidhya,而是根据作者的决定使用。

Leave a Reply

Your email address will not be published. Required fields are marked *