AI热点 2小时前 104 浏览次数 0 评论

全网都在玩 nano banana 生成手办,但这个 AI 真能给你做出来

AI中国
AI中国

发布了 10318 文章

最近,nano banana 火到不行,成了大家的 AI 玩具工厂。


只要给他一句提示,随便上传一张照片,它就能生成一个真实的桌面手办,桌子上还有一个包装盒子,一台显示着 3D 建模的电脑。


很多人第一次看到 nano banana 生成的桌面手办图片时,大概都会想问「这手办是哪里可以做?」


过去,答案是「做不了也买不到,是 AI 画的」。


现在,这个手办,真的能被打印出来,送到你的桌面上。


腾讯混元 3D 发布了全新 3.0 版本,带来了更丰富的细节和更真实的质感,我们的创意可以不用停留在文字、图片或视频,而是现实世界里,能够摸得着的物理实体。


相比前代 V2.5,3.0 版本在三个方面有了巨大升级:


人物生成质量:这是本次最大的亮点。


针对人物生成进行了专项优化,精度直接翻了三倍,V2.5 那种抽象脸彻底消失,现在的模型已经逼近真人手办级别


技术规格:首创了 3D-DiT 分级雕刻模型,支持高达 36 亿体素的超高清建模,能更好地兼顾模型的整体结构与局部细节。


综合能力:对于复杂几何结构,和不可见区域的还原能力更强,并且纹理的遵循度,和几何对齐精度也得到了进一步优化。


一张图片就是一个 3D 物体


既然手办能力是核心升级方向,我们这里先拿一张小草神的立绘,直接把它放到腾讯混元的图生 3D,和 Gemini 里面的 nano banana 模型,让它生成一张「定妆照」和一个真实的模型。




上传图片,使用腾讯混元 3D-V3.0 生成的模型。


还是忍不住感叹一句 nano banana 的强大,我的提示词里面根本没有提到,原神之类的词语,但它生成的盒子包装,有着很明显的原神 logo,和小草神的名字纳西妲(Nahida)。


混元 3D 3.0 也没有让我失望,小草神的表情、各种颜色的搭配,以及对上传图片的动作姿态还原,都非常高。


拿张罗小黑的电影海报,一样是先让 nano banana 看看,它生成的桌面手办是什么样子。



nano banana 发挥依旧稳定,把文字,人物的样子都做到了高度一致,让这个手办显得很真实。



而这是混元 3D 生成的模型,还原度非常高。


这里也体现了生图和生3D模型的根本区别:Nano banana 理解的是「生成一张手办图」的场景指令,所以它会补全人物和背景。


而混元3D理解的是「将这张图复刻成3D模型」的重建指令,所以它严格忠于原图内容,且不支持我们再输入提示词。


目前的混元图生 3D 页面,有提示对输入图片的要求。例如,背景简单,最好是纯色背景、不包含文字、单个主体、以及主体不要过小


这个时候的邪修玩法是,可以先让 nano banana 为我们编辑一个,符合图生 3D 的图片,有干净的背景、明确的主体、完整的人物。



Nano banana 生成的补全图(左),混元 3D 3.0 生成的模型(右)


这下终于得到了一个完整的人物手办,虽然因为图片信息的限制,罗小黑在师傅怀里的细节略显模糊,但整体形态已经非常完整。


游戏或动漫角色的纹理,远没有真人复杂。我们还从 unsplash 上找了一张,像是我们日常的人像街拍图片,进行测试。




衣服的褶皱,纹理和结构都有做到,但是想要头发、以及衣服材质这些细节,也保持一致,显然是太为难。


继续尝试使用 nano banana 去掉背景,展示完整的人物,混元 3D V3.0 生成的效果明显要更好。V2.5 的人脸看着就很抽象,没有太多的真实感和美观度。



从左至右,V3.0 生成的 3D 模型,V2.5 生成的 3D 模型,输入的照片(由 nano banana 生成)


在我的体验过程中,对比 V2.5,V3.0 最明显的提升,就是看到生成页面左侧,面数从最高 50 万扩展到了 150 万。



而面数增加,通俗来讲,带来最直接的变化,就是能对更复杂的物体,实现更高精度的建模,让人物生成效果得到大幅提升。



V2.5(左,46.4 MB)眼睛部分比较乱,衣服整体也不如 V3.0(右,143.1 MB)流畅。因为面数的增加,V3.0 的文件大小,更是 V2.5 的三倍之大。


除了单图,腾讯混元还提供了正视图、后视图、以及左右视图,多张图片上传生成 3D 模型的功能。


我们可以把自己手边的任何物品,拍摄 2-4 张图片,正视图是必须要有,然后上传到混元 3D 生成平台,就能得到一个精准复刻的虚拟分身。



依次是正视图、右视图、和后视图,图片来源:https://www.popmart.com/us/products/878/THE-MONSTERS---I-FOUND-YOU-Vinyl-Face-Doll



手办自由,真不是混元 3D 一句随随便便的口号。


没有左右视图,也可以直接用 nano banana 生成,一张哈利波特骑着扫帚的图片,然后要求 nano banana 生成左右视图和后视图。



原图(第一张),后面几张由 nano banana 生成


输入到混元 3D 的多图生成,我们就能得到一个哈利波特 3D 模型手办。



一句话也能让创意来到现实世界


如果觉得用 nano banana 来 P 图,或者上传照片太麻烦,我们还可以直接使用文生 3D,一句话就能创建一个 3D 物体。




向左滑动查看更多内容,


提示词:小孩,圆脸,毛绒衣物,手中拿奶龙玩偶,惊喜,卡通风格(左);


青年男子,身材修长,坐在单人沙发上,面前的书桌上放着一份预制菜和一杯果汁,笔记本电脑打开着,桌角有一盆小绿植,人物表情放松,极简风格(右)。


中秋节快到了,我们也让它生成几个 3D 月饼,还有前段时间,朋友圈大家都在发的血月。





人脸雕刻是混元 3D 3.0 的亮点,前面的图生 3D 已经证明了其还原能力。那么它的原创能力如何呢?


最近关于预制菜的讨论非常热,我们用混元 3D 的文生 3D,生成了一个西兰花带货主播。



而一些简单的角色创建,混元 3D 更是很容易就能做到。



提示词:一个留着棕色短发的年轻女/男性上半身。


都是红彤彤的脸蛋,但眼睛、眉毛这些细节做的都很好,直接用作动漫电影角色我觉得都可以。


因为腾讯混元 3D 模型,生成的内容,是实实在在的 3D 资产,且提供了丰富的下载格式,包括 STL、GLB 等。



我们可以从混元的生成页面,下载对应的 3D 文件,导入到其他软件中再处理,或者直接打印出来。


淘宝上一些商家有提供打印服务,单价基本上都在 0.5 元/克左右。部分城市或大学图书馆也有提供 3D 打印服务,例如下面是港中深图书馆提供的 3D 打印服务收费标准。



60g 材料能打多大?要看你选的填充率。常见的 15%-20% 填充,大概能打一个 10-12 厘米高的动漫角色手办。


但是,这些 3D 打印应该都是一种材料,所以最后出来的效果,大概率只是一个模型的几何结构,和网页预览会有差距,后续有上色等操作。



白模(左)和纹理(右)区别,由混元 3D 3.0 生成


除了 3D 打印,还有游戏开发、动画设计、甚至是有机会融入到,李飞飞最近发布的世界模型成果,可玩性拉满。


而为了更好的帮助 3D 设计师、游戏开发者、以及建模师等专业用户,混元 3D 在周五还发布了一站式、专业级 AI 工作台,混元 3D Studio。


混元 3D Studio 能帮助用户从最初的概念,到几何设计、纹理编辑、动画特效等 3D 设计全流程,获得极大的效率提升。目前已经开放了申请,加入候补名单就有机会上手体验。


混元 3D Studio 申请地址:


https://3d.hunyuan.tencent.com/studio


体验地址(每天有 20 次免费生成额度):


🔗 https://3d.hunyuan.tencent.com/




文章来自于微信公众号 “APPSO”,作者 “APPSO”

AI中国

AI中国

10318 文章 1803482 浏览次数 950300 粉丝

评论 (0)

睡觉动画