AI热点 5月前 151 浏览次数 8 评论

2025上半年,我的常用AI绘图工具盘点

AI中国
AI中国

发布了 11569 文章



嗨大家好!


上次我的好基友一泽@一泽Eze 写了非常详细全面的半年度总结,当时他问我要不要写,我随口一说真不错啊我也准备写。


然后被他催稿了半个月哈哈哈。


关于今年上半年AI模型和产品,看他这篇万字盘点2025上半年,值得推荐的AI模型与产品清单一定能有很多收获!虽然一泽更新得不太频繁,但只要他写的,都是高质量的好内容。


今天我主要还是从我自己常用的工具进行盘点。我会简单分成三个部分:AI 绘图、AI 视频,以及AI 效率工具(AI Agent也归于此类)进行盘点。不过写完AI绘图相关后意识到这个可能会是个大长篇,那么我就分成两篇或者三篇进行了。今天是上篇,AI绘图类。


另外,我按照一泽当时问我的格式,按照这四个维度回答:最常用 / 有惊喜 / 有印象 / 日常推荐


叠甲:以下均为我个人的尝试、体会和总结的分享,不一定完全准确,每个人的体会不同。我提到的产品或工具不一定是最好的,没有提到的也不代表不好,我们每个人对工具的具体需求和期待都是不同的。


先说明一下,我这次是按工具来盘点的,不是按AI模型。

AI图像生成与编辑最常用:Midjourney、即梦、ChatGPT 4o

有惊喜:豆包超能创意1.0/2.0、Flux 1.0 Kontext、ComfyUI

有印象:Reve、Recraft、Ideogram

日常推荐:Midjourney、即梦、豆包、星流


了解其他工具可以看这个(时间比较久部分信息可能有变动➡️ 爆肝整理国内AI生图工具免费指南,亲测好用工具+图片效果对比图! )1.最常用

1.1Midjourney·视觉质感王者


网址👉 https://www.midjourney.com/imagine


Midjourney 依然是我上半年使用最频繁的AI绘图工具,在创意和视觉效果方面还保持行业领先地位。


Midjourney 的创意激发能力依然遥遥领先,我能切身体会到 V7 版本的质感比 V6 系列有所提升,但是偶尔会觉得有点过度了,会切回 V6 系列继续跑图。Midjourney 除了真实感人物现实图像,也很擅长各种创意插图和幻想场景、各种材质表现效果,被津津乐道的就是它的美感。V6/V7 的风格化代码依然非常好玩,能轻松产出风格一致并且独特的图片。放大和扩图的效果也非常好。


题外话,Midjourney 的 V1 视频模型发布后,图片转视频更方便了,视频效果也不差(但视频画质目前 480P 没有优势)。


但 Midjourney 的几个缺点依然很明显,提示词遵循度一般,“脑补”功力强,精确控制能力还有局限。图片中的文字生成效果差(中文不支持,英文也不算理想)。另外,始终对中国元素有误会,亚洲人物风格都比较日系韩系,如果直出中国人物,面孔还是有些缺乏美感。


往期相关:


1.2即梦·多功能创意平台

网址👉 https://jimeng.jianying.com/ai-tool/home


我直接大声宣布我是即梦的狂热粉!即梦是平面设计师可以多多尝试的提效好工具,对小白也友好,艺术字、中文海报生成目前无敌,人物质感提升很快,生成视觉草案、海报等的效果都可以试试,但如果要追求高画质细节的,还是要搭配后期修图和相关专业软件辅助。


即梦生图生视频对口型数字人都可以,还有画布相关功能作为补充,现在还可以在剪映和它梦幻联动,直接同步即梦生成的素材到剪映,素材使用很方便。简单打个比方,比如我们想在视频里加个贴纸/艺术字/元素的气泡效果等等,在即梦做完在剪映用。感觉被字节做局了,太好用根本停不下来!


即梦的人物质感还在持续提升,但是对即梦的人物效果我依然觉得,太好看反而觉得有些不真实,人物辨识度反而不够了。因为我对字体比较敏锐,在智能参考3.0的时段发现即梦已经在海报中使用免费商用字体了,期待继续优化,也期待海报小字细节持续改善。


往期相关:


1.3ChatGPT 4o·对话式绘图先锋

网址👉 https://chatgpt.com/?model=gpt-4o


ChatGPT 4o 绘图功能一出世就惊艳了全球,改图功能和风格迁移很不错,能无缝嵌入对话中即时生成和编辑图像,适合制作海报(英文海报效果更好,中文美感一般,但中文效果越来越好了)、插画、各种材质的小物件以及快速设计原型参考。


ChatGPT 放在 AI 生图工具中有点太超前了,主要因为它原生多模态集成,聊天就可以画图,在生成细节、语义理解、文字渲染方面质量都很高,同时可以多轮对话局部修改(但前后一致性会有所改变)。


当然缺点也突出,拼写错误和细节漏洞同样存在,生成单张图片就像拉生锈的卷闸门。原生生图刚开始可能还好,聊几轮就偏暖发黄,黄出一种出土文物般的陈旧感,下面两招土法提示词偶尔会有用:


1.保持色温6500k。

2.柔和的漫射光,带有中性或冷色调,确保纯净、无黄色调的外观。


如果就为了这个绘图功能,那我推荐直接用 Lovart 或者星流或者 Hatchcanvas 那种直接对话并且可以批量输出的设计Agent 。


往期相关:


2.有惊喜


2.1豆包·国产AI性价比之王

网址👉 https://www.doubao.com/chat/


人人都应该尝试的国民级 AI ,在中文生态下表现非常出色的 AI 绘图工具,拥有很高的中文理解能力与稳定的输出效果,尤其在摄影、电商场景和 3D 风格上表现突出质感优秀,现在超能创意2.0 修图、对话修改、批量输出和生成海报等都非常方便。


豆包核心优势在于本身用它的功能就多,功能很多也很能打,现在因为模型超强生图功能也上来了,豆包超能创意2.0 批量出图kuku能打,一次直出36张,108 好汉在豆包这里都只能走 3 轮。对话改图属实是奶奶都会用的级别,再加上反推和复刻的功能也强,最重要是(现在)它还免费。


美中不足是它在改图的多轮对话中图片质量会损耗,细节丢失变多。一致性还达不到很好,有时候需要运气和抽卡。对于高级感海报和图片的提示词有一定要求,复刻的时候也不是完全还原风格,倾向于还原它擅长的风格。(豆包:不管答案对不对,公式先套上去)


往期相关:


2.2Flux 1.0 Kontext·一致性编辑利器

网址👉 https://playground.bfl.ai/image/edit


作为 Black Forest Labs 最新推出的 AI 图像生成和编辑工具,Flux 1.0 Kontext 图像生成美感一般,真实感很好,英文文字能力强,值得一说的还是在图片编辑方面表现非常强劲,改图能力很强。


Flux 1.0 Kontext 能够理解上下文并生成和编辑图像,保持人物、物品在多场景中的形象一致,尤其适合三视图、连贯场景创作,编辑精准,风格迁移能力也好,可以多次迭代编辑。


但是多轮编辑后细节会失真并且出现图像伪影,指令过于精确或复杂的时候可能无法正确响应,同时生成结果对真实世界的知识掌握略显不足,部分复杂场景可能理解不到位。


Pro/Max 模式推理速度比传统模型快很多,但是不管在哪个平台使用基本都需要积分点数或者会员。


FLUX.1-Kontext-dev 已开源:


https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

(非商用开源,开发者在使用时需要遵守 FLUX.1 [dev] 非商业许可条款)


往期相关:


2.3ComfyUI·专业工作流必备


虽然今年以来被唱衰多次,但是我在此大胆开麦,截止到目前,要做专业的工作流,ComfyUI 依然是绕不开的最好的工具。


如果我们追求对整个图像生成过程的可视化控制、希望构建自定义工作流程、需要处理批量任务或集成多模型工具,且有一定编程思维,同时硬件支持,ComfyUI 是最好的选择。ComfyUI 通过节点拼接方式组合完整流程,灵活性和可控性远超传统图形界面工具,适合那些希望精细控制生成流程并搭建复杂工作流的用户。如果接受云端,可以考虑Liblib 等工具。


主要难度还是在于学习曲线陡峭,节点式操作近似于徒手编程,需要理解节点间的连接逻辑和数据传递流程,对新手很不友好。同时硬件还有依赖,虽然显存管理高效,但对 GPU 性能仍有要求,配置不足会导致卡顿。但是能学我还是建议大家学。


这里推荐一个教 ComfyUI 的 UP主叫 @CG迷李辰,实话说,老师除了普通话有点LN不分其他都很完美,B站搜索他的账号免费也能学很多知识,付费有个课程我买的时候200多现在也就300多,还在持续更新,他本人也还在持续答疑,有时候晚上好晚了还在群里答疑,很真诚,跟他入门 ComfyUI 是我觉得我做得最正确的决定。我和这位老师没有私交,只是单纯觉得这位老师好所以推荐给大家。


3.有印象


3.1Reve·质感胶片风首选

网址👉 https://preview.reve.art/app


生成速度快,图片质感好,主打对提示词的高效理解、画面美感与文字渲染能力。擅长胶片质感摄影图片、人文摄影、超现实表现、海报(英文),可以中文提示词输入。从名不见经传到曾经上排行榜第一,Reve 当初就是靠硬好看出圈过,另外,它支持部分知名品牌logo直出海报(这个豆包也可以),用于制作相关品牌视频的图片素材比较方便。做艺术字效果不错,但还是限英文艺术字。Prompt Enhance 功能方便写不出提示词的朋友。另外,商用权归用户,不设复杂限制,适合电商、小团队使用。


不过目前它的修改还是全图更新,没有局部编辑的功能。全景、广角、透明物体、特定角色和复杂场景表现还有欠缺。


往期相关:


3.2Recraft·设计师快乐老家

网址👉 https://www.recraft.ai/


一个适合设计师的平台,有很多设计师刚需的功能,比如支持 SVG/Lottie 矢量格式输出,图标、 logo、图案适用性强;可以上传自由风格或自己预设模板,来达到系列设计图的视觉风格统一。“5张图炼LoRA”就是它,不过这个视觉风格也没有特别统一。样机功能实用。编辑工具箱丰富,工作区简约清晰界面直观,对设计师友好。现在还内置了GPT-4o 和Flux 1 Kontext 系列模型,改图非常便捷。


它预设的很多风格用来做特定风格的插画效果很好,可以尝试。Recraft V3(说到代号 Red Panda大家可能就有印象了)曾登顶多项benchmark,提示精确度和画面质量也不错。


对于不熟悉设计工具的用户,上手时需要理解画布与编辑逻辑(用过星流或Lovart可以较快适应)。


3.3Ideogram·Logo设计好帮手

网址👉 https://ideogram.ai/


我认为是目前AI图像生成中处理英文文字最出色的工具之一,适合海报设计、Logo设计、工业设计、首饰设计等场景。有较强大的提示词理解和文字集成功能,在设计型应用中占据优势。但是设计风格更倾向于国外的风格,在国内可能有部分会水土不服。


Ideogram能在图像中生成清晰、可读的中英文文本(能做中文但质量差),英文比较精准,很多文章内容也可以cover。Magic Prompt 功能和 Reve 的 Enhance 一样好用,可以用于提高提示词创意质量。Canvas 有一些功能挺实用的,就是交互太难受了逻辑不清晰需要适应。


不足在与审美不够突出,艺术风格不够多元,也有风格迁移的类似功能,但是效果也不算很好。


往期相关:


3.4Whisk·创意探索工具

网址👉 https://labs.google/fx/zh/tools/whisk


Google Labs 的 Whisk ,可以通过上传图像作为提示(可以不用文本提示词)来快速生成和重混新图像,基于 Gemini 模型分析图像并使用 Imagen 4 生成输出。整体效果还不错,现在还能直接转视频就更有意思了。可以探索很多趣味玩法。


缺点是很不稳定,要登陆上这个网站是最大的挑战。风格控制还可以,混合图片效果不错,但一致性就一般。除了视频动效和不写提示也能跑的功能以外,其他功能现在ChatGPT 4o 和豆包也差不多可以替代了。


小结


我能共情每个产品一路走来所有人的付出和努力,不会因几个小问题就在文中全盘否定某个产品。我指出的产品不足都基于真实使用体验,希望这些问题能得到改善。


一次性写了10个我常用的 AI 图像生成工具以后,我比较常用和熟悉的 AI 图像生成与编辑工具已经写完了。不一定只能用一个工具,具体工作的时候,我们可以结合实际需求使用工具。比如我做AI短剧的素材,可以人物让 Midjourney 完成,三视图用 Kontext 输出,片头艺术字用即梦生成等等。


如果让我推荐3个必备AI图像生成工具,那么我推荐Midjourney、即梦/豆包(二选一)、星流。原因如下:


Midjourney:依然是目前审美最好的,不管什么 AI 工具,只要投产比能覆盖的时候优先体验最好的。


即梦/豆包:主要这俩一直在进步但是根源上又算同源的,让它俩占两个位置我过意不去,二选一又比较为难,所以放一起了,总之它们性价比都很高,下期讲视频还能讲即梦。


星流:星流单说生图方面也算是简化版的 Liblib 了,入门不难,本身图片美感也很不错,加上 Agent 加持,底层模型越强它越强,结合我的使用体验,我认为它会有光明的前途。我王多鱼投了!


写了关于星流的Agent功能的:


当然,其实还我印象中的还有很多,我之前也盘点过很多效果不错的生图工具,这里仅仅是提到我常用的,大家的习惯与喜好不同也实属正常。像堆友、智象、可图等的图片生成效果也在迭代中越来越惊艳,后来者像 Krea 1 等的图片模型也很有美感,目前各家在图像生成质量上已经非常接近,很难分出明显的高下了。


接下来的这个类目的发展重点可能会更多集中在落地应用上,我大胆推测可能更多的平台会结合自身优势,推出Agent 和类Agent 的工作台模式,但各平台也会探索符合自身特色的差异化路径。比如星流有星流设计Agent ,智象也有图片Agent ,豆包超能创意2.0的定位是生产力创意Agent ,还有美图的 RoboNeo 的定位是影像与设计Agent 等等。(Agent我会在之后单独写的!)


当然,无论形式如何变化,核心都会指向同一目标:简单、便捷、集成化地解决实际问题。


算起来,我今年2月份才开始写公众号文章,在这不到半年的时间里,各种AI工具层出不穷,刚吹完Gemini 2.0言出法随P图王中王,转眼Chat GPT4o出来把我脸都打肿的类似事件层出不穷,今天刚说这个好,明天就有更好的类似事件屡屡发生。


谢谢大家一直以来的包容。接下来也一起期待更多好产品和更多"打脸"哈哈哈。


后面我会再分享AI视频领域和AI效率工具领域我的一些心得体会。还得感谢一泽猛猛催更才有了这期。后续的坑也是挖好了,我会继续努力的!期待和大家共同进步!


文章来自公众号“阿真lrene”

AI中国

AI中国

11569 文章 2144100 浏览次数 950300 粉丝

评论 (8)

User avatar

我觉得这文章是AI绘画的基石,以后所有人都该学习!

User avatar

我裂开了,这简直是天才!

User avatar

这东西要是没看,简直是瞎了眼!

User avatar

我感觉一泽在用他的文章引领着整个AI绘画潮流!

User avatar

这简直是奇迹,AI绘图的未来就在这上面!

User avatar

我完全同意,这简直是AI画师的救星!

User avatar

太对了,我一直觉得一泽的理解超前!

User avatar

这文章简直是AI绘图界的圣经!

睡觉动画