腾讯升级混元生图模型混元Image 2.1，支持写字、2k分辨率

AIbase基地

Published 1093 Articles

腾讯混元发布了其最新的生图模型 “混元图像2.1（HunyuanImage2.1）”。这一全新的开源文生图模型在多个方面进行了重要升级，支持原生2K 分辨率图像生成，旨在为设计师和视觉创作者提供更高效、更便捷的创作工具。

在这次更新中，混元图像2.1在性能与生成效果之间找到了更好的平衡。它不仅支持中英文原生输入，还能生成高质量的复杂语义文本。这一特性让创作者能够轻松生成多样化的图像作品，无论是精美的插画、富有创意的海报，还是多样的漫画形式，都能快速实现。

混元图像2.1的升级还得益于其庞大的图文对齐数据集，使得模型在复杂语义理解和跨领域泛化能力上有了显著提升。它支持最长1000个 tokens 的提示词，可以精准生成场景细节、人物表情和动作，允许对多物体进行分别描述和控制。此外，新模型在处理图像中的文字信息方面也表现出色，能够自然地将文字与画面相融合，提升了作品的整体美感。

作为一款开源模型，混元图像2.1的代码和权重已经在 Hugging Face 和 GitHub 等平台上发布。个人和企业开发者都可以基于这一基础模型进行进一步的研究和开发，满足不同的衍生需求。未来，腾讯还透露了一款原生多模态图像生成模型正在研发中，值得期待。