全新开源免费模型DeepFloyd IF，解决了文生图的两大难题：准确绘制文字和准确理解空间关系。

全新开源免费模型DeepFloyd IF，解决了文生图的两大难题：准确绘制文字和准确理解空间关系。

五月 08, 2023

视频描述更详细，更全面：点击观看

Stable Diffusion 团队背后的公司StabilityAI再放大招，全新开源模型DeepFloyd IF。目前已经在githob开源了。相比市面上名气最大的几款文本转图片的大型AI，midjourney，这个是行业老大，Stable Diffusion，还有openai的DALL-E。他们都是收费的。目前DeepFloyd是可以免费使用的。全新开源免费模型DeepFloyd IF：官方地址

咱们来详细看下它的介绍。

DeepFloyd IF不光图像质量是照片级的，还解决了文生图的两大难题：准确绘制文字和准确理解空间关系。

这是一种最新颖的，开源文本到图像模型，首先它会形成一个64*64的图像模型

然后可以不断增加图片的分辨率，最高呢能达到1024*1024

可以通过图片生成图片，通过图片生成不同类型的，不同风格的图片

还可以通过这个模型使图片变清晰

增加图片的效果等等

其中最优秀的能力是，可以准准确的识别文字，对于文本直接生成商用的海报

又迈进了关键的一步

目前市面上最大的文本转图片的AI模型还是无法实现的，比如说midjourney V5模式

还是无法在图片中精准的生成文本

打开这个使用网站

使用方法呢也很简单

这里输入正面的提示词

这里输入反面的几字词

有高级设置和不同的模式

因为他的语言呢原声语言还是英语，绘图还是需要用英文作为关键词。