Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

AIGC创作
23年5月6日
编辑

UISDC

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

大家好，这里是和你们一起探索 AI 绘画的花生~

4 月份的时候给大家介绍了 Stability AI 新推出新模型 Stable Diffusion XL，它的参数是 SD v2.1 的 2.5 倍，整体图像生成质量也比 v2.1 要好很多。不到半个月时间，Stability AI 又推出了一个新的文本到图像模型 DeepFloyd IF，今天我们就继续看看这个新模型的功能。

AI绘画神器Stable Diffusion模型再升级！新版亮点全面盘点！

大家好，这里是和你们聊设计的花生~

之前为大家对比了 6 款在线 AI 绘画软件在不同主题上的图像生成效果，最终是 Midjourney 的整体表现最好，而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。

阅读文章 >

DeepFloyd IF

DeepFloyd 官网： https://deepfloyd.ai/

DeepFloyd IF 模型试玩： https://huggingface.co/spaces/DeepFloyd/IF

DeepFloyd 是 Stability AI 旗下的多模态 AI 研究实验室，这次的 IF 模型就是由 DeepFloyd 研发的。据官方介绍，DeepFloyd IF 是最新最先进的开源文本-图像模型，拥有强大的语言理解能力，生成的图像具有高度真实感。从其官网展示了图像来看，DeepFloyd IF 生成的图像质量非常不错，也能处理多种不同的风格效果。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

DeepFloyd IF 生成的图像，图片内容来源：DeepFloyd 官网

上面的这些图像也体现了 DeepFloyd IF 另外的 2 项优势 —— 能在图像中生成连贯清晰的文本，以及理解不同对象的属性和空间关系。比如它可以正确地将文字呈现在路牌、纸片、包装外壳等规定的媒介内；能理解文本之间的连续关系，将不同的字母或数字按顺序呈现在不同的物体上；以及分清圆球是金属的，三角形是毛茸茸的，不会将不同物体的属性弄混。

我用同一组提示词在 Stable Diffusion XL、DeepFloyd IF 和 Midjourney 中分别进行了测试，结果见下图。可以看到 SD XL 虽然显示了文字，但是文字内容并不准确，也没有有突出文字的主体位置，显然是模型对文本的理解能力有限；Midjourney 生成图像质量很高，但是文字部分是错的；DeepFloyd IF 对文字内容和涂鸦风格把握都很准确，整体效果最好。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

推特上也有很多网友利用 DeepFloyd IF 成功生成各种具有清晰文字内容的图像，说明 IF 模型的这项功能的非常稳定。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

内容来源： https://twitter.com/deepfloydai

DeepFloyd 还在官网上展示了 IF 模型与其他的模型的效果对比，包括 OpenAI 的 DALLE·2、Google 的 Imagen 和 Parti，以及 Stability AI 自己的 Stable Diffusion v2.1。从对比图可以看出 DeepFloyd IF 的图像生成质量并不逊于其他模型，在语言理解方面方面甚至表现更好，比如在和 DALLE·2 的对比图中，IF 模型可以更好地理解“a handpalm 一只手掌”这个概念。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

DeepFloyd IF 与其他模型的对比

与 Stable Diffusion、DALLE·2 等模型不同的是，DeepFloyd IF 是一个由冻结文本编码器和三个级联像素扩散模块组成的。三个扩散模块分别为一个基于文本提示生成 64x64 像素图像的基本模型，和两个超分辨率模型。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

也就是说使用一般的绘画工具，我们直接就能生成一张 512*512px 或者 1024*1024px 的分辨率图像，而 DeepFloyd IF 则是先生成一张 64*64px 的基础图像，然后再通过两个超分辨率模型对其进行分辨率提升。这一点在 DeepFloyd IF 试玩 Demo 中也体现了出来：输入提示词后，会先得到一个模糊的 64*64px 的图像，然后选择“Upscale”进行放大，才会得到一个 1024x1024 px 的信息图像。这个特点让 IF 模型在生成基础图像时速度比一般模型快很多，图像生成效率更高。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

除了根据文本提示生成图像，DeepFloyd IF 还有一个根据图像生成类似图像的功能，整个过程也非常有意思。DeepFloyd IF 会先将原图缩减至 64 px，通过正向扩散添加一定程度的噪声，然后在逆向扩散过程中使用新文本提示对图像进行去噪，从而实现图像到图像的转换。这样以保留原图的基础构图、色彩等信息，然后再根据文本提示，生成不同样式、风格和细节的图像。

DeepFloyd IF 还有 Super Resolution 和 Inpainting 功能。Super Resolution 即提升画面的分辨率，前面提到过 IF 模型本身就自带 2 个超分辨率模型，而对于并非由 IF 生成的图像，也可以用 IF 模型进行放大。Inpainting 则是通过涂抹修改图像局部内容，且修改后的内容能与原画面的风格保持一致。

Stability AI 又出新模型 DeepFloyd ！AI设计海报指日可待了

DeepFloyd IF 目前没有正式的应用，只在 Huggingface 上提供了一个试玩 Demo，感兴趣的朋友可以戳下面的链接试一试。DeepFloyd IF 模型及生成的内容目前不可商用，仅供研究使用。团队目前在开放收集关于 IF 模型的反馈意见，之后会发布一个完全免费的商业兼容版本。

DeepFloyd IF 模型试玩： https://huggingface.co/spaces/DeepFloyd/IF

DeepFloyd IF 模型的出现意味着 AI 绘画的可控性得到了进一步的提升，特别是在能生成连贯准确的文字内容这方面，让 AI 绘画工具在未来可以在设计领域有更广泛得的应用，比如生成具有准确文字的图片素材、具有特殊效果的字体设计，甚至是进行准确地排版。本期文章封面的配图就是用 DeepFloyd IF 生成的，你觉得 DeepFloyd IF 还会哪些其他的发挥它的优势呢？欢迎在评论区分享你的看法~

推荐阅读：

AI绘画哪家强？Midjourney、文心一格等 6 大工具出图效果大比拼

大家好，这里是和你们一起探索 AI 绘画的花生~

3 月份以来 AI 绘画领域又有了不小的变化，Midjourney 更新了 V5 版本、Stable Diffusion 推出了 Clipdrop Reimagine；微软 Bing 也推出了 Image Create （图像生成）功能

阅读文章 >

AI绘画必看！5个实用技巧让图像生成效率提升200%

大家好，这里是和你们一起探索 AI 绘画的花生~

想必很多设计师小伙伴都在用 Midjourney 生成各种设计灵感或者素材，比如 3D 人物、UI 界面，渐变纹理、矢量插画等，而且只要我们掌握了其中的关键词或者公式，就能快速生成对应的效果，非常方便。

阅读文章 >

1、CNBE.CC所有文章，如无特殊说明或标注，均为本站作者原创发布。
2、任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
3、如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。
4、CNBE.CC内用户所发表的所有内容及言论仅代表其本人，并不反映任何CNBE.CC之意见及观点。

aigc AI创作 AI绘画 AI设计 DeepFloyd

!

你也想出现在这里？立即联系！

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

❯

购物车

优惠劵

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
CNBE公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部