在 Stable Diffusion WebUI (原生,未安装其他插件)中有 3 个地方可以实现图片放大功能。

  1. 文生图中 Sampling method 下面的 Hires. fix (高分辨率修复);
  2. 图生图中 Script 选择 SD upscale;
  3. Extras (高清化)标签中,支持批量处理。

在这 3 个地方使用到的算法是一样的,只不过使用场景不一样。

下面介绍不同放大算法区别

Lanczos

蓝佐斯算法

出图速度较快,放大效果一般,

Nearest

最临近点差值算法

出图速度较快,放大效果一般,放大后会有明显像素颗粒感。

Lanczos,Nearest 是比较老的传统算法,不是AI模型,不推荐使用

ESRGAN_4x

ESRGAN 系列算法放大后会对细节进行重绘。
如果单纯进行放大,推荐使用 ESRGAN_4x,适用于照片写实类

R-ESRGAN 4x+

R-ESRGAN 4x+ Anime6B

在放大真人图片时,观感上像是给真人加了一层手绘滤镜,

LDSR

运行时间最长,需要单独下载模型,从效果上,不论是动漫,还是真人,效果都不错,会对各种细节进行精细的重绘制。(可能与原图出现色差,需要修改白平衡)

ScuNET GAN

ScuNET PSNR

SwinIR 4x

上面3种算法更侧重图片降噪,这类放大算法的核心比较复杂,简单来说就是建立一个对抗网络,让这个网络去判断图像放大的好坏,最终得出成功放大的图像。

不同的对抗网络有不同的参数和逻辑,这导致生成的图也会有细微差别。

SD图片放大案例图:

SD图片放大案例图

参考:

  1. https://zhuanlan.zhihu.com/p/612572004
  2. https://www.youtube.com/watch?v=LXAi2A2YEXQ&list=PL4L5yXcAegdxwcD2RRffQntmXygv26auT&index=23&ab_channel=氪學家
  3. https://www.bilibili.com/read/cv23381975/