Midjourney操作界面

Imagen

4.8
0热度
访问官网

最先进的文本到图像转换技术Imagen研究亮点我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。在COCO上,我们实现了7.27的最新COCO FID并

最先进的文本到图像转换技术

Imagen研究亮点

  • 我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。
  • 我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。
  • 我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。
  • 我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。
  • 在COCO上,我们实现了7.27的最新COCO FID并且人类评价者发现Imagen样本在图像-文本对齐方面与参考图像不相上下。

立即下载

相似工具

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部