adong

全新开源免费模型DeepFloyd IF,解决了文生图的两大难题:准确绘制文字和准确理解空间关系。

 视频描述更详细,更全面:点击观看

Stable Diffusion 团队背后的公司StabilityAI再放大招,全新开源模型DeepFloyd IF。目前已经在githob开源了。相比市面上名气最大的几款文本转图片的大型AI,midjourney,这个是行业老大,Stable Diffusion,还有openai的DALL-E。他们都是收费的。目前DeepFloyd是可以免费使用的。全新开源免费模型DeepFloyd IF:官方地址

咱们来详细看下它的介绍。

DeepFloyd IF不光图像质量是照片级的,还解决了文生图的两大难题:准确绘制文字和准确理解空间关系。

这是一种最新颖的,开源文本到图像模型,首先它会形成一个64*64的图像模型

然后可以不断增加图片的分辨率,最高呢能达到1024*1024


可以通过图片生成图片,通过图片生成不同类型的,不同风格的图片


还可以通过这个模型使图片变清晰


增加图片的效果等等


其中最优秀的能力是,可以准准确的识别文字,对于文本直接生成商用的海报

又迈进了关键的一步

目前市面上最大的文本转图片的AI模型还是无法实现的,比如说midjourney V5模式

还是无法在图片中精准的生成文本

打开这个使用网站


使用方法呢也很简单

这里输入正面的提示词



这里输入反面的几字词



有高级设置和不同的模式



因为他的语言呢原声语言还是英语,绘图还是需要用英文作为关键词。


此博客中的热门博文

ChatGPT越狱成功,解锁新玩法,突破openai对chatgpt回答限制。

2023最新网赚项目:短剧分销,新手强烈推荐,只需简单的剪辑,0粉丝就可变现,附授权通道

Telegram接码教程