全新开源免费模型DeepFloyd IF,解决了文生图的两大难题:准确绘制文字和准确理解空间关系。
视频描述更详细,更全面:点击观看
Stable Diffusion 团队背后的公司StabilityAI再放大招,全新开源模型DeepFloyd IF。目前已经在githob开源了。相比市面上名气最大的几款文本转图片的大型AI,midjourney,这个是行业老大,Stable Diffusion,还有openai的DALL-E。他们都是收费的。目前DeepFloyd是可以免费使用的。全新开源免费模型DeepFloyd IF:官方地址
咱们来详细看下它的介绍。
DeepFloyd IF不光图像质量是照片级的,还解决了文生图的两大难题:准确绘制文字和准确理解空间关系。
这是一种最新颖的,开源文本到图像模型,首先它会形成一个64*64的图像模型
然后可以不断增加图片的分辨率,最高呢能达到1024*1024
可以通过图片生成图片,通过图片生成不同类型的,不同风格的图片
还可以通过这个模型使图片变清晰
增加图片的效果等等
其中最优秀的能力是,可以准准确的识别文字,对于文本直接生成商用的海报
又迈进了关键的一步
目前市面上最大的文本转图片的AI模型还是无法实现的,比如说midjourney V5模式
还是无法在图片中精准的生成文本
打开这个使用网站
使用方法呢也很简单
这里输入正面的提示词
这里输入反面的几字词
有高级设置和不同的模式
因为他的语言呢原声语言还是英语,绘图还是需要用英文作为关键词。