最近AI生图赛道简直卷疯了!
从Nano Banana的爆火,到即梦AI 4.0,豆包4.0接连上线,一直专注于视频大模型的Vidu也按捺不住了:
Vidu Q1参考生图堂堂登场!同时支持7张参考。
主体一致性比起谷歌Nano Banana也毫不逊色。
(Nano Banana最多支持3张参考图)
量子位抢先实测了这款模型,它的表现相当不错——能够自由引用的7张参考图,带来了极高的可操作性。
用简单的自然语言描述即可。
或者是直接生成时尚大片,现场拍摄啥的都省了。
我们探索了很多有趣的玩法,提示词、图片都放在下面了,一起来看一下!
7张参考图,能怎么玩?
我们实测了几种玩法,比如让各种违和的元素凑成一张和谐的画面、或者是制作时尚大片……
可以说,只要有创意,万物皆可合成。
万物皆可合成
无论是让秦始皇骑北极熊在上海喝柠檬水:
还是让李白坐火箭成功登月:
参考图一放,就看Vidu Q1参考生图的结果是否符合想象。
潮流单品秒变OOTD
既然有那么多参考,岂不是可以直接全套换装?
所有单品一键上身,是时候展现搭配之力了(摩拳擦掌)。
用这套提示词,不管是地中海还是西海岸通通可行。
在线试衣再也不是问题。
一个人也能拍时尚大片
光是换装还不够,更进一步,生成一张海报级别的写真如何?
看,只需要简单的提示词,背景、光影、构图都可以随意调整。
合照?不,是大合照
双人合照已经满足不了需求了,来点更多的?
让少年漫主角齐聚一堂怎么样。
即使画风差别过大,甚至跨了一个次元,也可以自然地出现在同一个画面里。
更多玩法等待探索
当然,更有趣的玩法还有很多。
基本上Nano banana能做的,Vidu Q1参考生图也可以。
无论是小某书爆火的手办生成。
还是设计稿变3D立体效果。
又或者最经典的主体替换。
同类产品多数仅支持1-3张参考图,且很多不能支持同一类型的多元素参考,比如同时参考多个人物。
而Vidu Q1参考生图可同时支持7张参考图,并在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。
测试数据全面超越Flux Kontext,直接对标Nano Banana。
一致性能力评分全场最佳。
最后让我们简单介绍一下Vidu Q1参考生图的使用方法。
在参考生图页面,支持7张参考图片,上传后会显示在下方的输入栏,可以拖动和更改提示词。
也可以输入【@】选择图片。
点击创建主体可以输入自己的常用数据,或许三视图效果更佳。
目前仅有1080p分辨率,可选择生成图片的宽高比和生成数量,最多可一次生成4张。
Vidu Q1参考生图现已全球同步上线,欢迎大家在评论区分享自己的作品~
实测地址:https://www.vidu.cn/create/reference2image
文章来自于“量子位”,作者“不圆”。