沉浸式体验Stability AI最新超强AI图片生成模型Ultra

2024年9月4日,亚马逊云科技在Amazon Bedrock上新了Stability AI最新的的三款文本图像生成模型:他们分别是Stable Image UltraStable Diffusion 3 LargeStable Image Core。全新的模型在处理多主题提示词、图像质量和图片排版上较上一代模型有显著提升,能够更块地生成高质量的视觉内容,我们们的日常可以应用的场景包括市场营销、广告、媒体、娱乐、零售等多个领域。

这一代全新的模型令小李哥印象最深刻的就是可以生成具有惊人写实度的图像,细节、颜色和光线处理能力十分优秀,能够解决日常的渲染问题,比如生成真实的手部和面部图像。它们的高级提示理解能力还允许模型准确理解更为复杂的提示指令,比如处理空间推理、构图和风格等需求。大家听完介绍后是不是很心动呢?下面就跟着我一起了解这次Stability AI发布的新款模型,并学习如何在亚马逊云科技平台上调用该模型API。

这次Stability AI发布的三款模型是什么?

这三款Stability AI模型适用于不同的使用场景:

  • Stable Image Ultra

        专为专业媒体机构和对图片内容要求极高的应用提供最高质量的接近于现实的输出,擅长呈现极致的细节与真实感。

  • Stable Diffusion 3 Large

    在生成速度和输出质量之间进行了折中,非常适合创建高质量的大批量数字内容,如网站、新闻通讯和营销材料。
  • Stable Image Core

    优化了图像生成的速度和成本,非常适合在概念构思阶段实现图像创意的样例。

利用Stability AI模型生成图片展示

小李哥觉得这次新发布的Stable Image Ultra和Stable Diffusion 3 Large与上一代模型Stable Diffusion XL (SDXL) 相比的最关键的提升就是——生成图像中的文字质量。在模型所使用的全新Diffusion Transformer架构支持下,生成的图片在拼写和排版出现的错误更少,这一架构实现了图像和文字的两个独立权重集,但能够在两种模式之间进行信息流动,从而增强了生成图像中的文字表现和准确度。

以下就是生成的图像示例:

Stable Image Ultra:

我们输入提示词:"照片,写实,一名女子坐在田野里看着风筝飞向天空,天空要下雨,图片中包括大量细节,概念艺术,复杂,专业构图。"我们可以得到以下生成图片:

Stable Diffusion 3 Large:

我们输入提示词:"漫画风格插图,一个男侦探站在街灯下,黑帮城市风格,该男侦探穿着风衣,戴着礼帽,天气阴暗且多雨,街道挂满了霓虹灯牌,路面湿漉漉的,反射忧郁的灯光,细节丰富。"我们可以得到以下生成图片:

Stable Image Core:

我们输入提示词:"生成一双白色和橙色运动鞋的3D图片,悬浮在中央,高质量,写实。"我们可以得到以下生成图片:

全新Stability AI模型在 Amazon Bedrock上的应用场景

文本生成图像模型在各行各业都可以被广泛应用,尤其是游戏、市场营销和广告部门的图像设计工作。这些模型可以快速生成高质量的视觉内容,用于广告活动、社交媒体图片和产品模型,加速生产力和产品交付周期。此外,这些AI模型能够在图像设计中带来更多超越常规想象的创意,提供实时的概念视觉表达,激发更多产品方面的创新。

对于电商业务,Stablitily AI生成的图像可以帮助创建大规模的多样化的产品展示和定制化的营销材料。在UI设计领域,利用该模型也可以快速生成样例界面,加速设计迭代周期。将AI应用到这些领域可以显著降低成本,提高生产力,并在视觉方面为开发者的项目和业务带来竞争优势。

热门应用场景:

  • 广告和市场营销

    • Stable Image Ultra可以用于生成产品展示图,如奢侈品牌广告
    • Stable Diffusion 3 Large生成高质量产品营销图像和广告
    • Stable Image Core快速生成社交媒体广告视觉概念,便于A/B 测试
  • 电商

    • Stable Image Ultra用于高端产品定制和定制商品设计图
    • Stable Diffusion 3 Large生成电商网站上大多数产品的视觉内容
    • Stable Image Core快速生成产品图像并更新商品图片列表
  • 媒体和娱乐

    • Stable Image Ultra生成超写实的艺术作品和游戏视觉
    • Stable Diffusion 3 Large用于游戏内环境纹理、角色设计和游戏内道具
    • Stable Image Core进行快速的游戏原型设计和概念艺术探索

亚马逊云科技上使用全新Stability AI模型的方法

通过亚马逊云科技Amazon Bedrock控制台

1. 进入Amazon Bedrock服务后,在Playgrouds操作台选择图片模型,选中Stable Image Ultra模型

 2. 在提示词中输入如下内容生成一个蒸汽机器人:

A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says "Stability AI models in Amazon Bedrock".

3. 我们最终得到如下生成的图片 

通过亚马逊云科技CLI命令行工具生成图片

我们可以运行以下Bash命令调用Amazon Bedrock上的Stability AI模型生成图片

aws bedrock-runtime invoke-model \
--model-id stability.stable-image-ultra-v1:0 \
--body "{\"prompt\":\"A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says \\\"Stability AI models in Amazon Bedrock\\\".\",\"mode\":\"text-to-image\",\"aspect_ratio\":\"1:1\",\"output_format\":\"jpeg\"}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg

API调用参数如下:

1)--model-id stability.stable-image-ultra-v1:0: 模型ID

2)body.prompt: 图片生成提示词

3)body.mode:text-to-image: 生成模式选择为根据图片生成图片

4)aspect_ratio:1:1:生成图片比例为1比1

5)output_format: jpeg:输出格式选择JPEG

6) --cli-binary-format raw-in-base64-out:以Base64编码输出

7)--region: 大模型所在区域

通过Python代码生成图片

我们也可以使用亚马逊云科技的Python SDK Boto3编写代码,调用Amazon Bedrock上的Stability AI模型AI生成图片,实例代码如下:

import base64
import boto3
import json
import os

MODEL_ID = "stability.stable-image-ultra-v1:0"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")

print("Enter a prompt for the text-to-image model:")
prompt = input()

body = {
    "prompt": prompt,
    "mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))

model_response = json.loads(response["body"].read())

base64_image_data = model_response["images"][0]

i, output_dir = 1, "output"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
    i += 1

image_data = base64.b64decode(base64_image_data)

image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
    file.write(image_data)

print(f"The generated image has been saved to {image_path}")

以上就是在亚马逊云科技上利用Stability AI全新发布的模型生成逼真现实度图片的全部步骤。欢迎大家关注小李哥未来获取更多国际前沿的亚马逊云科技生成式AI云开发/云架构方案。 


http://www.niftyadmin.cn/n/5664662.html

相关文章

一个基于 laravel 和 amis 开发的后台框架, 友好的组件使用体验,可轻松实现复杂页面(附源码)

前言 随着互联网应用的发展,后台管理系统的复杂度不断增加,对于开发者而言,既要系统的功能完备,又要追求开发效率的提升。然而,传统的开发方式往往会导致大量的重复劳动,尤其是在构建复杂的管理页面时。有…

多目标优化算法(Multi-Objective Optimization Algorithms, MOOA)介绍

在现实世界中,许多问题都涉及到多个目标的权衡和优化。例如,在工程设计中,可能需要同时考虑成本、效率和可靠性;在资源管理中,可能需要平衡环境保护和经济效益。多目标优化算法(Multi-Objective Optimizati…

Vue+nodejs+express旅游景区门票预订网站的设计与实现 8caai前后端分离

目录 技术栈具体实现截图系统设计思路技术可行性nodejs类核心代码部分展示可行性论证研究方法解决的思路Express框架介绍源码获取/联系我 技术栈 该系统将采用B/S结构模式,开发软件有很多种可以用,本次开发用到的软件是vscode,用到的数据库是…

大数据Flink(一百一十八):Flink SQL水印操作(Watermark)

文章目录 Flink SQL水印操作(Watermark) 一、为什么要有WaterMark 二、​​​​​​​​​​​​​​Watermark解决的问题 三、​​​​​​​​​​​​​​代码演示 Flink SQL水印操作(Watermark) 一、​​​​​​​为什么…

Java SE基础知识详解:源于技术书籍的深度解读

写在前面 ⭐️在无数次的复习巩固中,我逐渐意识到一个问题:面对同样的面试题目,不同的资料来源往往给出了五花八门的解释,这不仅增加了学习的难度,还容易导致概念上的混淆。特别是当这些信息来自不同博主的文章或是视…

策略模式结合反射在电商支付系统中的深入应用与实战解析

在电商支付系统的设计中,策略模式与反射的结合使用可以进一步提升系统的灵活性和可扩展性。反射(Reflection)是Java等编程语言提供的一种能力,允许程序在运行时检查或修改类的行为。结合策略模式,反射可以动态地加载和…

MODIS/Landsat/Sentinel下载教程详解【常用网站及方法枚举】

⛄前言 在当今快速发展的地球观测时代,遥感技术作为获取地球表面及其环境信息的重要手段,正以前所未有的广度和深度改变着我们对自然界的认知与管理方式。MODIS(Moderate-resolution Imaging Spectroradiometer,中分辨率成像光谱…

如何在 Qt 的 QListWidget 中逐行添加和显示数据

文章目录 如何在 Qt 的 QListWidget 中逐行添加和显示数据目标实现步骤1. 在 Qt Designer 中添加 QListWidget2. 在代码中逐行添加数据示例代码 代码解析3. 使用自定义项 运行效果总结 如何在 Qt 的 QListWidget 中逐行添加和显示数据 QListWidget 是 Qt 提供的一个非常方便的…