AI热点 5 hours ago 177 Views 0 Comments

Wan2.5+Midjourney V7,阿里夸克这个新AI鲨疯了!价格还砍一大刀

量子位

Published 536 Articles

一水 梦瑶 发自 凹非寺

量子位 | 公众号 QbitAI

夸克“造点”AI发布了!

直接上大招,Wan2.5+Midjourney V7双强模型联合!

之前一直传闻,夸克在AIGC方面会有大动作,今天终于正式揭晓了。不仅如大家期待的一样,接入了Midjourney最新版本的V7模型,还直接把会员价格打下来了一半。

但更重磅的是!夸克“造点”还在今天第一时间,率先接入了阿里自家刚刚发布的视频生成模型通义万相Wan2.5,甚至直接开放了7天免费体验。

阿里AI2C的大将“夸克”,搭配AI2B的最强王者“通义”系列模型,一技能Q(Quark),二技能W(Wan),真是一套漂亮的丝滑连招!

“造点”首页,两个模型都已上线,有AI生图、AI生视频两个入口:


https://zaodian.quark.cn/

Wan2.5+Midjourney V7到底有多强?这么说吧:

一个夸克“造点”AI=生图+生视频+加配乐+对口型+P图编辑,实在太丝滑了!

来看案例:

让图中所有人一起大合唱!瞧瞧这整齐划一的姿势动作、唱歌口型,怎么不算另一种别开生面的“文艺复兴”呢(doge)。

国庆在即,想来北京旅游的朋友可得听听劝了,来自东北的土拨鼠童鞋已经提前替大家踩坑了,瞧这小表情、小口型,活灵活现!

当然,博物馆也可以唱歌“营业”(bushi,流量自然少不了。

怎么样?!绝美图片+音视频同步生成,质感在线,体验丝滑。

接下来,再详细看看“造点”这个产品。

PC端:Wan2.5+Midjourney V7,最强款就是要搭最强款!

夸克这次发布的“造点”AI,主打的是AI生图和AI生视频两大核心功能,slogan是用想象“造点”不同——

想要生成图片?它有号称“美学天花板”的AI生图模型Midjourney V7,还是无需魔法、中文友好、功能全部在线的那种,无论是MJ的老熟人,还是刚入坑的新手,都能立即上手;

想要生成视频?最新发布的通义万相Wan2.5确实足够惊艳,也让“造点”成为了当前国内首个支持音视频同步生成的AI平台,视频生成的同时,会自动匹配对应的人声、音效和音乐BGM,还支持声音驱动。

这套强强联合,妙啊!

再来看看AI生图的界面。

其实有两个模型可选,用户可以根据需求自由切换,Midjourney不多说了,夸克图片1.0主打的亚洲人像、文字生成及国风元素,简言之更适合需要中文文字的场景,比如电商、平面设计及影视游戏等场景。

在Midjourney V7选项下,“造点”已经全面支持了多图参考风格代码精细化参数控制等核心功能,并且还对海外版做了一些优化。

比如在“美学控制”上直接设计了滑块,不再需要手动输入权重,而是可以通过鼠标拖动,自由设计风格化怪异化多元化三个参数。

此外,对比原版,“造点”还提供了“智能润色”“特征词库”两个按钮,可以更简单轻松地上手,尤其是“特征词库”这里,一口气支持120多个视角、光线、风景、构图的提示词,点一下就能直接用,非常方便!

当一张图片生成,点击这个“生视频”的按钮,就可以直接跳转到Wan的界面,接着生成视频。

这一套连招效果究竟如何?咱们测试几个高难度的案例。

一镜到底有亿点丝滑

一上来,不妨直接让肾上腺素飙升一下,来一场一镜到底竞速大戏。

Midjourney V7首先登场,先秒秒钟生成一张质感满满的赛博朋克城市科幻大片:

然后让Wan2.5迅速接棒,考考它能否顺利生成一段“无人机视角”下的一镜到底视效大片。

这里我们还有意增加了难度——在飞行途中,镜头需多次贴脸掠过路牌、栏杆和疾驰火车,保持连续推进、遮挡合理,还要带上列车飞速行驶的音效。

最终生成的结果be like:

值得一提的是,Wan2.5生成的音效也很能打。要知道给视频加音效并不是难事儿,难的是能让AI实现音效内容与画面节奏的精准对齐。但在“造点”上,可以一气呵成地实现了。

拍拍商业级微距特写广告,同样不在话下

“拍完电影”,接下来试试专业级的广告玩法——让这对黄金搭档拍一条营销、时尚度兼具的口红大片。

Midjourney V7依旧稳定发挥,生成的照片非常真实自然,不论是构图还是光线,都有棚拍内味儿了。

基于这张静态图,我们试着用AI做出广告级的动效运镜,零零碎碎的要求提了一大堆:

镜头要有微距级的推进与旋转,能顺滑地切焦到口红膏体的细闪与纹理质感;配乐也不能拉垮,要求有节奏感、带鼓点、有高光氛围的广告感音效……

结果面对这种鱼和熊掌都要的“刁难”,“造点”AI还是“一口气”顺利地交出了满意答卷:

短短5秒,本·甲方本甲也只能默默退场了。

更懂中国元素,动态古风也玩得溜

当然了,作为一款国产AI,懂中国元素也是必不可少的。

这一次难度大升级,直接让Midjourney V7生成一张人挤人、层次复杂的古代市井图。

不仅每个人的动作都不一样(有人推车、有人闲聊、有人扭头张望),而且还是一个第三人视角的微观环境。

结果AI还真把画面中的所有元素都玩“活”了——

仔细听,背景音效,吆喝声和脚步声有层次感,灯笼轻晃、纸张抖动这些细节也都处理得恰到好处。

还有这些脑洞大开的玩法

刚刚那几段,比较偏概念风、镜头感强。

接下来,我们换个口味,来点真正“好玩”的内容生成,看看Wan2.5在趣味场景下还能整出什么花活~

巨大猫猫,还能发出可爱的喵喵叫:

兵马俑吃月饼:

ASMR更是不在话下:

这波Midjourney V7+Wan2.5的玩法,“造点”还真是造了点想象力!

移动端:一句话任意P图

除了上面提到的“造点”网页端,夸克这次还发布了“造点”的移动端玩法,入口就在夸克APP内的“AI生图”板块

点击后就会进入一个以对话形式为主的页面,在这里,你可以用语言指令,实现各种图片编辑、创意玩法。

比如换发型:

prompt:把图片中女孩的发型换成翘翘头,其他不变。

人物一致性表现得确实可以,长发遮挡住的身体区域也都补全还原了。

当然还能换发色:

prompt:把图片中的女孩头发换成银色/红色/棕色/粉色

再来试试换背景的效果咋样:

prompt:背景一键上戛纳红毯,其他不变。

此外,在“造点”的灵感广场,还提供了大量玩法模板,3D手办生成一键风格转绘AI视频特效…热门玩法,样样齐全!更适合想简单尝试、体验模板玩法的用户。

One More Thing

效果显贵,价格就不显贵!

这一次,除了集成海内外各种顶尖模型,夸克还把创作成本狠狠打下来了。

有多狠呢?

咱们算一笔账,Midjourney V7会员价格48元/月,可生成400张,对比海外版10美元/月,生成200张,价格直接腰斩!

视频生成方面,更是得益于夸克和通义的强强联手,在“造点”上直接开放了7天免费畅玩体验!(9月24日-30日)这一波,太值得冲了!

土拨鼠听了都得欢呼一阵(手动狗头)GoGoGo!:

传送门:https://zaodian.quark.cn/

量子位

量子位

536 Articles 81771 Views 9840 Fans

Comment (0)

睡觉动画