AI热点 1 weeks ago 56 Views 0 Comments

刚刚,字节登顶世界最强图像AI!一手实测原生4K、10图融合,全网玩疯

AI中国
AI中国

Published 10462 Articles


谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。


等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。



谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!


就在刚刚,字节跳动发布的豆包·图像创作模型Seedream 4.0,一举拿下了Artificial Analysis「文生图」和「图像编辑」两大榜单的第一。





一键创作+编辑,原生4K分辨率,一次最多上传10张参考图。


如今,全网的画风是这样子的——






有网友随手扔了一张糊到爹妈都不认的图,Seedream 4.0直出一张超清版的,简直是废片秒变神作。




生图不仅是它的强项,Seedream 4.0还具备了超强的知识和推理能力。


就比如,一边生图,一边解方程;生成的冰激凌配方图,逻辑清晰;一键比较建筑特点,美观且要点明了......






这是因为,Seedream 4.0首次将「生成图像」和「图像编辑」(SeedEdit 3.0),全部整合到单体模型中。


相较于上一代,4.0版本生成文字清晰又准确,尤其是在中文文字渲染上,效果碾压GPT-4o、Gemini 2.5 Flash。


比如,我们想把下面这听饮料上面的字换成「新智元」。



Seedream 4.0给出的结果,不仅光影正确,而且字体也很有设计感。



相比之下,谷歌Nano Banana生成的,除了「新」字之外,可以说是是驴唇不对马嘴。



更多对比如下:






可以说,Seedram 4.0的横空出世,一夜之间掩盖了谷歌「香蕉」所有光芒。


现在,打开「火山方舟体验中心」,就可以免费体验4K高清多模态生图了!




传送门:https://www.volcengine.com/experience/ark?launch=seedream


一手实测,更适合中国宝宝


多图融合,是最常见的一种玩法儿。


不论是「双人同框」,还是每日穿搭、模仿火柴人动作草图等等,Seedream 4.0可以全部拿捏。


甚至,一次上传10张参考图,它都能以正确的逻辑融合成一张图。


十图无缝合成,生成专属OOTD


就比如,今日份OOTD穿搭,Seedream 4.0就能直接帮你承包了。



让图1女孩穿上图2的穿搭


上传一张个人照片,再淘一张穿搭图,上身效果如何,几秒就能get了。


令人惊艳的是,照片生成的太自然了,人物一致性非常高,肉眼根本辨别不出是AI生成的。



再换一套简约风格的,果然人美穿啥都好看。



接下来加大难度,一次上传八张图片:一张主角,五张配饰,外加一只杜宾和一辆吉普汽车。


为了让图像呈现得更加美观,提示要求男子站在汽车一旁,狗紧挨着男主。



图1的男子穿上第2、3、4、5、6张图的穿搭,站在第八张图汽车前,第七张图小狗站在男人身旁


不得不说,Seedream 4.0理解力一绝,还能准确地给男主穿上衣服,戴上配饰。



随便一个pose模板,Seedream 4.0便可以让任何人做出相同的动作。


一位古装女子和一位画上的皇帝,做图3的摆拍,那会是怎样的效果?



将图1、图2合进一张图里,参考图3姿势


快看,这张合照堪称「天作之合」,真是挑不出一点毛病,比拍照还真。



再比如,自己想要一张和霉霉合照,Seedream 4.0就可以帮你实现愿望。



图1和图2女生合拍,两人表现自然一些,背景是上海东方明珠夜景


上传两张图后,一句话,即可无缝合成。


可以看到,照片中人物的衣服、头发颜色等细节非常一致,而且动作自然,没有出现人物失真的情况。



现场手绘一个「火柴人」,就让犬夜叉和杀生丸来一个打斗摆拍。



让图1和图2两个人,模仿图3的姿势


没想到,就这么随笔一画,让Seedream 4.0就让动漫人活灵活现了。



还有3D物理世界小人,Seedream 4.0也可让其动作1:1复刻。



图1女生做图2的动作


连续生图,淘汰制片人?


想连续做动画或视频,缺少灵感?


Seedream 4.0还具备了强大的「连续生图」的能力,只要输入剧情描述,AI即可自动生成多个关键画面帧。


最后,再借助AI视频工具,合成动态视频。


从故事脚本到视觉呈现,一个人即可轻松搞定Vlog、创意短片,从此制作效率翻倍。


举个栗子,你可以让名画中的人,在同一时空下相遇。



图1的梵高和图二的蒙娜丽莎,在图3的一家酒吧里偶遇,然后两人在图4露天小餐馆畅谈,需要环境的局部特写,比如酒馆的光影,酒杯特写等。


梵高和蒙娜丽莎在一家酒吧偶遇后,两人又去户外小餐馆畅聊。



动漫连载,下一个宫崎骏是你


我们再来做一个动漫连环画,上传一张有人物角色的照片。



然后,若是想要指定的画面,把所有故事分镜的脚本扔给Seedream 4.0。


保持封面参考图的绘画风格和封面的主体,下面每句话帮忙生成一句故事分镜(一共5个分镜):


1. 夏日清晨,小女孩背着绣小熊的布包,牵着卷毛小狗从家门口出发,门廊竹席上还放着没喝完的绿豆汤。


2. 两人走到公园长椅旁,小狗突然追着粉蝴蝶跑远,小女孩举着刚摘的狗尾草。


3. 路过野菊花丛,小女孩蹲下来摘小黄花,小狗叨起一朵送到她手边,花瓣上还有露珠。


4. 听到远处卖冰粉的叫卖声,小女孩牵着小狗跑过去,买了碗红糖冰粉,用小勺子喂小狗尝了口。


5. 突然下起小雨,小女孩拉着小狗躲进公园的木亭子,小狗缩在她脚边,用脑袋挨着她。


不一会儿工夫,五个分镜全部出来了。画面效果非常惊艳,而且人物画面全部保持一致。







电影分镜,堪比好莱坞大片


一直以来,人们都难以相信,一款AI工具如何能砸掉制片人的饭碗?


当你真正体验之后,就会惊叹这就是现实!


接下来,上传一张女主和一张男主的照片,任何人就可以直接拍出一部短剧。



prompt:参考图片形象,生成三种影视分镜:第一幕女主去买帽子;第二幕转角遇到了图2的帅气男子;第三幕男主向女主表达爱慕,两人微笑。复古风格。


第一幕:女主去买帽子。


值得一提的是,在第一幕画面生成中,Seedream 4.0还整了一个高难度——镜面。


可以看到,女主表情和镜子中一致,包括帽子、耳钉、珍珠项链、衣服等等,和原图保持高度一致。



第二幕,女主出门转角,偶遇到了男主。


这一幕中,Seedream 4.0放大了视角,营造了一种「魔法版」的偶遇,逼真还原了男女主。



第三幕,男主向女主表达爱慕。


注意看,这里的镜头又被拉近,男女主之间的甜蜜溢出了屏幕,一根羽毛成为了他们之间爱情的见证。



是不是感觉情节太过精彩,还没有看够。不如,接下来的故事,就由你们来续写~


创意玩法,脑洞大开


除了多图融合、连续生图,Seedream 4.0还有各种本领。


比如,让它取出汉堡的所有馅料,只保留顶部和底部的面包片。而且,两个面包片之间空隙间隔,要与原来的一致。



Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.


一个只有面包,没有夹层的汉堡就闪现了。



它还可以生成一个可爱小狗的桌面手办。



根据草图,生成对应主体的立体搪胶手办,摆放在深色电脑桌上


除了图片的生成和编辑外,Seedream 4.0还拥有智能——它真的理解图片上的内容。


比如让它推断生成,一张上海东方明珠照片12个小时后的样子。



12个小时后,城市展示的景色


模型不仅正确推断出12小时后是夜景,而且建筑物的细节、角度等也都非常完美的还原。


补全后的4k图像真的是相当清晰。



再比如,给它一个时间,然后问1分钟之后会显示什么。



Seedream 4.0也能正确推断出相应的时间,而且其他参数也都没有随意改动。


草图建模也不在话下。


设计师有福了。



根据草图,设计出完整建筑,并上色


可以看到,模型不仅完美还原出建筑的设计细节以及外部材料的质感,为了方便展示顶部的设计,它甚至还改变了视角。


简直太贴心了。



还可以反过来玩,将建筑转换成模型,而且是不同的角度。


这都需要模型进行很多推理。



把建筑做成不同视角的全景模型,白色的背景,微缩模型,需要四张,不同角度,分别是鸟瞰图、顶视图、侧视图、仰视图



最近还流行的一种玩法是制作教程。


比如让Seedream 4.0生成一张牛肉汉堡制作步骤教程图,绘制在手账本上。


可以看到最后的教程步骤清晰,实用性很高。



彩铅手账风格,出一个牛肉汉堡制作步骤教程图,步骤说明要中文,女生手写可爱字体,绘制在一个手账本上


更进一步的应用是制作信息图表。


这个应用不仅好玩儿,还更有教育意义——一下子把枯燥的文字知识变成图表,让学习的效率指数型上升。


举个栗子:牛顿第二定律。



提示词:“牛顿第二定律”信息图表,包括科普文字、示意图和基础物理公式,分列进行排版


太香了。上学时要是有这东西,我的成绩绝对还能上升两个层次。


一键接入API


当然,作为一家云平台,火山引擎也支持API接入,面向开发者解锁更多玩法。



在火山引擎拿到自己的API KEY后,只需点击上图中的API接入,就可以看到调用的示例代码。



在红框内换成自己的API KEY后,直接复制代码放到终端即可。


大家看一下Seedream 4.0文生图的质量。


生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上



除了文生图外,API还支持图生图、多图融合、组图输出等多种玩法,大家可以自己去体验。



传送门:https://www.volcengine.com/experience/ark?launch=seedream



文章来自于微信公众号 “新智元”,作者 “新智元”

AI中国

AI中国

10462 Articles 1846971 Views 950300 Fans

Comment (0)

睡觉动画