Stability AI于2024年2月12日开源了新一代文生图模型Stable Cascade,与过往的Stable Diffusion模型相比,Stable Cascade使用更小的潜在空间进行训练和推理,训练更高效,推理速度更快,并且在prompt对齐和美学质量方面表现最佳,下图显示了Stable Cascade(30 个推理步骤)与 Playground v2(50 个推理步骤)、SDXL(50 个推理步骤)、SDXL Turbo(1 个推理步骤)、 Würstchen v2(30 个推理步骤)等模型在prompt对齐和美学质量上的对比。

image

Stable Cascade 对效率的重视通过其架构和更高的压缩潜在空间得到了证明。尽管最大的模型比Stable Diffusion XL(SDXL) 多出 1.4B 参数,但它仍然具有更快的推理时间,下图为Stable Cascade、SDXL、Playground v2 和SDXL Turbo之间的推理速度差异。

image-1710587470342

生成图片效果对比(Stable Cascade模型与SDXL 模型)

左边是Stable Cascade生成的图片,右边是SDXL生成的图片:

image-1710587482507

提示词:text“stable”,Made from green shrub leaves,

image-1710587489026

提示词:text“stable”,The text is made of colorful energy.

image-1710587492846

提示词:A cute cat

image-1710587502144

提示词:A high-definition full body photo of a beautiful Asian girl in a summer park,full-size photograph,full-size photograph

Stable Cascade的代码和模型均已开源,更多介绍可参见:

中文介绍:https://mp.weixin.qq.com/s/gXNj9dueR627UGDGwwfyZA

官方文章:https://stability.ai/news/introducing-stable-cascade

代码地址:https://github.com/Stability-AI/StableCascade