2025上半年，我的常用AI绘图工具盘点

嗨大家好！

上次我的好基友一泽@一泽Eze 写了非常详细全面的半年度总结，当时他问我要不要写，我随口一说真不错啊我也准备写。

然后被他催稿了半个月哈哈哈。

关于今年上半年AI模型和产品，看他这篇万字盘点2025上半年，值得推荐的AI模型与产品清单一定能有很多收获！虽然一泽更新得不太频繁，但只要他写的，都是高质量的好内容。

今天我主要还是从我自己常用的工具进行盘点。我会简单分成三个部分：AI 绘图、AI 视频，以及AI 效率工具（AI Agent也归于此类）进行盘点。不过写完AI绘图相关后意识到这个可能会是个大长篇，那么我就分成两篇或者三篇进行了。今天是上篇，AI绘图类。

另外，我按照一泽当时问我的格式，按照这四个维度回答：最常用 / 有惊喜 / 有印象 / 日常推荐

叠甲：以下均为我个人的尝试、体会和总结的分享，不一定完全准确，每个人的体会不同。我提到的产品或工具不一定是最好的，没有提到的也不代表不好，我们每个人对工具的具体需求和期待都是不同的。

先说明一下，我这次是按工具来盘点的，不是按AI模型。

AI图像生成与编辑最常用：Midjourney、即梦、ChatGPT 4o

有惊喜：豆包超能创意1.0/2.0、Flux 1.0 Kontext、ComfyUI

有印象：Reve、Recraft、Ideogram

日常推荐：Midjourney、即梦、豆包、星流

了解其他工具可以看这个（时间比较久部分信息可能有变动➡️ 爆肝整理国内AI生图工具免费指南，亲测好用工具+图片效果对比图！）1.最常用

1.1Midjourney·视觉质感王者

网址👉 https://www.midjourney.com/imagine

Midjourney 依然是我上半年使用最频繁的AI绘图工具，在创意和视觉效果方面还保持行业领先地位。

Midjourney 的创意激发能力依然遥遥领先，我能切身体会到 V7 版本的质感比 V6 系列有所提升，但是偶尔会觉得有点过度了，会切回 V6 系列继续跑图。Midjourney 除了真实感人物现实图像，也很擅长各种创意插图和幻想场景、各种材质表现效果，被津津乐道的就是它的美感。V6/V7 的风格化代码依然非常好玩，能轻松产出风格一致并且独特的图片。放大和扩图的效果也非常好。

题外话，Midjourney 的 V1 视频模型发布后，图片转视频更方便了，视频效果也不差（但视频画质目前 480P 没有优势）。

但 Midjourney 的几个缺点依然很明显，提示词遵循度一般，“脑补”功力强，精确控制能力还有局限。图片中的文字生成效果差（中文不支持，英文也不算理想）。另外，始终对中国元素有误会，亚洲人物风格都比较日系韩系，如果直出中国人物，面孔还是有些缺乏美感。

往期相关：

1.2即梦·多功能创意平台

网址👉 https://jimeng.jianying.com/ai-tool/home

我直接大声宣布我是即梦的狂热粉！即梦是平面设计师可以多多尝试的提效好工具，对小白也友好，艺术字、中文海报生成目前无敌，人物质感提升很快，生成视觉草案、海报等的效果都可以试试，但如果要追求高画质细节的，还是要搭配后期修图和相关专业软件辅助。

即梦生图生视频对口型数字人都可以，还有画布相关功能作为补充，现在还可以在剪映和它梦幻联动，直接同步即梦生成的素材到剪映，素材使用很方便。简单打个比方，比如我们想在视频里加个贴纸/艺术字/元素的气泡效果等等，在即梦做完在剪映用。感觉被字节做局了，太好用根本停不下来！

即梦的人物质感还在持续提升，但是对即梦的人物效果我依然觉得，太好看反而觉得有些不真实，人物辨识度反而不够了。因为我对字体比较敏锐，在智能参考3.0的时段发现即梦已经在海报中使用免费商用字体了，期待继续优化，也期待海报小字细节持续改善。

往期相关：

1.3ChatGPT 4o·对话式绘图先锋

网址👉 https://chatgpt.com/?model=gpt-4o

ChatGPT 4o 绘图功能一出世就惊艳了全球，改图功能和风格迁移很不错，能无缝嵌入对话中即时生成和编辑图像，适合制作海报（英文海报效果更好，中文美感一般，但中文效果越来越好了）、插画、各种材质的小物件以及快速设计原型参考。

ChatGPT 放在 AI 生图工具中有点太超前了，主要因为它原生多模态集成，聊天就可以画图，在生成细节、语义理解、文字渲染方面质量都很高，同时可以多轮对话局部修改（但前后一致性会有所改变）。

当然缺点也突出，拼写错误和细节漏洞同样存在，生成单张图片就像拉生锈的卷闸门。原生生图刚开始可能还好，聊几轮就偏暖发黄，黄出一种出土文物般的陈旧感，下面两招土法提示词偶尔会有用：

1.保持色温6500k。

2.柔和的漫射光，带有中性或冷色调，确保纯净、无黄色调的外观。

如果就为了这个绘图功能，那我推荐直接用 Lovart 或者星流或者 Hatchcanvas 那种直接对话并且可以批量输出的设计Agent 。

往期相关：

2.有惊喜

2.1豆包·国产AI性价比之王

网址👉 https://www.doubao.com/chat/

人人都应该尝试的国民级 AI ，在中文生态下表现非常出色的 AI 绘图工具，拥有很高的中文理解能力与稳定的输出效果，尤其在摄影、电商场景和 3D 风格上表现突出质感优秀，现在超能创意2.0 修图、对话修改、批量输出和生成海报等都非常方便。

豆包核心优势在于本身用它的功能就多，功能很多也很能打，现在因为模型超强生图功能也上来了，豆包超能创意2.0 批量出图kuku能打，一次直出36张，108 好汉在豆包这里都只能走 3 轮。对话改图属实是奶奶都会用的级别，再加上反推和复刻的功能也强，最重要是（现在）它还免费。

美中不足是它在改图的多轮对话中图片质量会损耗，细节丢失变多。一致性还达不到很好，有时候需要运气和抽卡。对于高级感海报和图片的提示词有一定要求，复刻的时候也不是完全还原风格，倾向于还原它擅长的风格。（豆包：不管答案对不对，公式先套上去）

往期相关：

2.2Flux 1.0 Kontext·一致性编辑利器

网址👉 https://playground.bfl.ai/image/edit

作为 Black Forest Labs 最新推出的 AI 图像生成和编辑工具，Flux 1.0 Kontext 图像生成美感一般，真实感很好，英文文字能力强，值得一说的还是在图片编辑方面表现非常强劲，改图能力很强。

Flux 1.0 Kontext 能够理解上下文并生成和编辑图像，保持人物、物品在多场景中的形象一致，尤其适合三视图、连贯场景创作，编辑精准，风格迁移能力也好，可以多次迭代编辑。

但是多轮编辑后细节会失真并且出现图像伪影，指令过于精确或复杂的时候可能无法正确响应，同时生成结果对真实世界的知识掌握略显不足，部分复杂场景可能理解不到位。

Pro/Max 模式推理速度比传统模型快很多，但是不管在哪个平台使用基本都需要积分点数或者会员。

FLUX.1-Kontext-dev 已开源：

https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

（非商用开源，开发者在使用时需要遵守 FLUX.1 [dev] 非商业许可条款）

往期相关：

2.3ComfyUI·专业工作流必备

虽然今年以来被唱衰多次，但是我在此大胆开麦，截止到目前，要做专业的工作流，ComfyUI 依然是绕不开的最好的工具。

如果我们追求对整个图像生成过程的可视化控制、希望构建自定义工作流程、需要处理批量任务或集成多模型工具，且有一定编程思维，同时硬件支持，ComfyUI 是最好的选择。ComfyUI 通过节点拼接方式组合完整流程，灵活性和可控性远超传统图形界面工具，适合那些希望精细控制生成流程并搭建复杂工作流的用户。如果接受云端，可以考虑Liblib 等工具。

主要难度还是在于学习曲线陡峭，节点式操作近似于徒手编程，需要理解节点间的连接逻辑和数据传递流程，对新手很不友好。同时硬件还有依赖，虽然显存管理高效，但对 GPU 性能仍有要求，配置不足会导致卡顿。但是能学我还是建议大家学。

这里推荐一个教 ComfyUI 的 UP主叫 @CG迷李辰，实话说，老师除了普通话有点LN不分其他都很完美，B站搜索他的账号免费也能学很多知识，付费有个课程我买的时候200多现在也就300多，还在持续更新，他本人也还在持续答疑，有时候晚上好晚了还在群里答疑，很真诚，跟他入门 ComfyUI 是我觉得我做得最正确的决定。我和这位老师没有私交，只是单纯觉得这位老师好所以推荐给大家。

3.有印象

3.1Reve·质感胶片风首选

网址👉 https://preview.reve.art/app

生成速度快，图片质感好，主打对提示词的高效理解、画面美感与文字渲染能力。擅长胶片质感摄影图片、人文摄影、超现实表现、海报（英文），可以中文提示词输入。从名不见经传到曾经上排行榜第一，Reve 当初就是靠硬好看出圈过，另外，它支持部分知名品牌logo直出海报（这个豆包也可以），用于制作相关品牌视频的图片素材比较方便。做艺术字效果不错，但还是限英文艺术字。Prompt Enhance 功能方便写不出提示词的朋友。另外，商用权归用户，不设复杂限制，适合电商、小团队使用。

不过目前它的修改还是全图更新，没有局部编辑的功能。全景、广角、透明物体、特定角色和复杂场景表现还有欠缺。

往期相关：

3.2Recraft·设计师快乐老家

网址👉 https://www.recraft.ai/

一个适合设计师的平台，有很多设计师刚需的功能，比如支持 SVG/Lottie 矢量格式输出，图标、 logo、图案适用性强；可以上传自由风格或自己预设模板，来达到系列设计图的视觉风格统一。“5张图炼LoRA”就是它，不过这个视觉风格也没有特别统一。样机功能实用。编辑工具箱丰富，工作区简约清晰界面直观，对设计师友好。现在还内置了GPT-4o 和Flux 1 Kontext 系列模型，改图非常便捷。

它预设的很多风格用来做特定风格的插画效果很好，可以尝试。Recraft V3（说到代号 Red Panda大家可能就有印象了）曾登顶多项benchmark，提示精确度和画面质量也不错。

对于不熟悉设计工具的用户，上手时需要理解画布与编辑逻辑（用过星流或Lovart可以较快适应）。

3.3Ideogram·Logo设计好帮手

网址👉 https://ideogram.ai/

我认为是目前AI图像生成中处理英文文字最出色的工具之一，适合海报设计、Logo设计、工业设计、首饰设计等场景。有较强大的提示词理解和文字集成功能，在设计型应用中占据优势。但是设计风格更倾向于国外的风格，在国内可能有部分会水土不服。

Ideogram能在图像中生成清晰、可读的中英文文本（能做中文但质量差），英文比较精准，很多文章内容也可以cover。Magic Prompt 功能和 Reve 的 Enhance 一样好用，可以用于提高提示词创意质量。Canvas 有一些功能挺实用的，就是交互太难受了逻辑不清晰需要适应。

不足在与审美不够突出，艺术风格不够多元，也有风格迁移的类似功能，但是效果也不算很好。

往期相关：

3.4Whisk·创意探索工具

网址👉 https://labs.google/fx/zh/tools/whisk

Google Labs 的 Whisk ，可以通过上传图像作为提示（可以不用文本提示词）来快速生成和重混新图像，基于 Gemini 模型分析图像并使用 Imagen 4 生成输出。整体效果还不错，现在还能直接转视频就更有意思了。可以探索很多趣味玩法。

缺点是很不稳定，要登陆上这个网站是最大的挑战。风格控制还可以，混合图片效果不错，但一致性就一般。除了视频动效和不写提示也能跑的功能以外，其他功能现在ChatGPT 4o 和豆包也差不多可以替代了。

小结

我能共情每个产品一路走来所有人的付出和努力，不会因几个小问题就在文中全盘否定某个产品。我指出的产品不足都基于真实使用体验，希望这些问题能得到改善。

一次性写了10个我常用的 AI 图像生成工具以后，我比较常用和熟悉的 AI 图像生成与编辑工具已经写完了。不一定只能用一个工具，具体工作的时候，我们可以结合实际需求使用工具。比如我做AI短剧的素材，可以人物让 Midjourney 完成，三视图用 Kontext 输出，片头艺术字用即梦生成等等。

如果让我推荐3个必备AI图像生成工具，那么我推荐Midjourney、即梦/豆包(二选一)、星流。原因如下：

Midjourney：依然是目前审美最好的，不管什么 AI 工具，只要投产比能覆盖的时候优先体验最好的。

即梦/豆包：主要这俩一直在进步但是根源上又算同源的，让它俩占两个位置我过意不去，二选一又比较为难，所以放一起了，总之它们性价比都很高，下期讲视频还能讲即梦。

星流：星流单说生图方面也算是简化版的 Liblib 了，入门不难，本身图片美感也很不错，加上 Agent 加持，底层模型越强它越强，结合我的使用体验，我认为它会有光明的前途。我王多鱼投了！

写了关于星流的Agent功能的：

当然，其实还我印象中的还有很多，我之前也盘点过很多效果不错的生图工具，这里仅仅是提到我常用的，大家的习惯与喜好不同也实属正常。像堆友、智象、可图等的图片生成效果也在迭代中越来越惊艳，后来者像 Krea 1 等的图片模型也很有美感，目前各家在图像生成质量上已经非常接近，很难分出明显的高下了。

接下来的这个类目的发展重点可能会更多集中在落地应用上，我大胆推测可能更多的平台会结合自身优势，推出Agent 和类Agent 的工作台模式，但各平台也会探索符合自身特色的差异化路径。比如星流有星流设计Agent ，智象也有图片Agent ，豆包超能创意2.0的定位是生产力创意Agent ，还有美图的 RoboNeo 的定位是影像与设计Agent 等等。(Agent我会在之后单独写的！)

当然，无论形式如何变化，核心都会指向同一目标：简单、便捷、集成化地解决实际问题。

算起来，我今年2月份才开始写公众号文章，在这不到半年的时间里，各种AI工具层出不穷，刚吹完Gemini 2.0言出法随P图王中王，转眼Chat GPT4o出来把我脸都打肿的类似事件层出不穷，今天刚说这个好，明天就有更好的类似事件屡屡发生。

谢谢大家一直以来的包容。接下来也一起期待更多好产品和更多"打脸"哈哈哈。

后面我会再分享AI视频领域和AI效率工具领域我的一些心得体会。还得感谢一泽猛猛催更才有了这期。后续的坑也是挖好了，我会继续努力的！期待和大家共同进步！

文章来自公众号“阿真lrene”

登录账号

2025上半年，我的常用AI绘图工具盘点

Midjourney

HuggingFace

即梦AI APP

KontextAI

Imagen

KREA

AI中国

评论 (8)

MoonEcho77

NovaByte

MoonEcho77

EchoVerse_99

MoonEcho77

EchoVerse_99

NovaByte

MoonEcho77

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

速抢（2核2G）77元/年香港免备案服务器

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

2025上半年，我的常用AI绘图工具盘点

Midjourney

HuggingFace

即梦AI APP

KontextAI

Imagen

KREA

AI中国

评论 (8)

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

速抢（2核2G）77元/年香港免备案服务器

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

为您推荐