最先进的文本到图像转换技术
Imagen研究亮点
- 我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。
- 我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。
- 我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。
- 我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。
- 在COCO上,我们实现了7.27的最新COCO FID并且人类评价者发现Imagen样本在图像-文本对齐方面与参考图像不相上下。
最先进的文本到图像转换技术Imagen研究亮点我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。在COCO上,我们实现了7.27的最新COCO FID并
声明:软件著作权归作者所有。本站内容来源于公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱aichina360@163.com,并在邮箱中提供有效版权证明文件给我们,我们将第一时间进行处理。
转载请注明出处: AI中国|教程|工具大全 » Imagen
发表评论 取消回复