AI热点 6月前 242 浏览次数 10 评论

Dive3D – 北大联合小红书推出的文本到3D生成框架

发布了 11569 文章

Dive3D是什么

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配(Score Implicit Matching,SIM)损失替代传统的KL散度目标,有效避免模式坍塌问题,显著提升3D生成内容的多样性。Dive3D在文本对齐、人类偏好和视觉保真度方面表现出色,在GPTEval3D基准测试中取得优异的定量结果,证明了在生成高质量、多样化3D资产方面的强大能力。

Dive3D的主要功能

  • 多样化3D内容生成:根据文本提示生成多种风格和细节的3D模型,避免传统方法中常见的模式坍塌问题,即生成结果过于单一和相似。
  • 高质量3D模型生成:支持生成的3D模型具有较高的视觉保真度,包括精细的纹理细节、逼真的几何形状和合理的光照效果等。
  • 良好的文本对齐能力:支持生成的3D模型与输入的文本描述高度匹配,准确地反映文本中提到的各种元素和特征。
  • 支持多种3D表示形式:支持生成不同类型的3D表示,如神经辐射场(NeRF)、高斯点云(Gaussian Splatting)和网格(Mesh)等,满足不同应用场景和用户的需求。

Dive3D的技术原理

  • 分数隐式匹配(Score Implicit Matching,SIM)损失:Dive3D的核心技术之一。传统的基于KL散度的损失函数(如在Score Distillation Sampling,SDS中使用)会导致模式寻求行为,让生成模型倾向于生成高密度区域的样本,限制生成的多样性。SIM损失直接匹配生成内容的概率密度梯度场(分数)和扩散先验的分数,避免KL散度的问题,鼓励模型探索多个高概率区域,在保持保真度的同时提高生成的多样性。
  • 统一的散度视角框架:Dive3D将扩散蒸馏和奖励引导优化整合到一个基于散度的框架中。框架包括三个核心的散度损失,条件扩散先验损失(CDP)、无条件扩散先验损失(UDP)和奖励损失(ER)。基于合理地组合和调整损失的权重,在生成的多样性、文本对齐和视觉质量之间取得平衡。
  • 基于扩散模型的优化:Dive3D用预训练的2D扩散模型(如Stable Diffusion)作为先验知识,基于多视图渲染将3D表示优化为与文本提示相匹配的2D图像。在优化过程中,迭代地对3D模型进行渲染、计算损失并更新模型参数,让生成的3D模型的渲染图像逐渐接近预训练扩散模型所期望的图像分布。
  • 高效的优化算法:为提高优化效率,Dive3D用高效的优化算法和策略。例如,引入分类器自由引导(Classifier-Free Guidance,CFG)技术,在优化过程中更好地平衡文本条件和无条件的生成效果;基于合理设置噪声时间表和优化步长等参数,加快优化收敛速度,减少生成时间。

Dive3D的项目地址

  • 项目官网:https://ai4scientificimaging.org/dive3d/
  • GitHub仓库:https://github.com/ai4imaging/dive3d
  • arXiv技术论文:https://arxiv.org/pdf/2506.13594

Dive3D的应用场景

  • 游戏开发:快速生成游戏中的角色、道具和场景。根据游戏剧本中的描述,自动生成具有不同风格和细节的游戏角色模型,减少美术设计的工作量。
  • 影视制作:为电影、电视剧和动画制作提供创意原型和概念设计。根据剧本描述生成场景和角色的3D模型,帮助导演和美术师更好地进行创意构思。
  • 建筑设计:根据文本描述生成建筑模型,帮助建筑师快速展示设计概念,进行方案比较和优化。
  • 虚拟场景构建:为VR和AR应用生成逼真的虚拟场景和物体。在虚拟旅游应用中,根据用户输入的地点描述生成相应的3D场景,让用户身临其境地体验虚拟环境。
  • 科学教育:生成复杂的科学模型,如生物细胞、分子结构等,帮助学生更好地理解抽象的科学概念。

11569 文章 2144100 浏览次数 950300 粉丝

评论 (10)

User avatar

北大小红书搞了个啥?3D生成太酷了!

User avatar

“这3D生成,我猜一定是上帝在搞实验,太搞人了!”

User avatar

“这3D,我感觉它要统治宇宙,人类以后只能当宠物!”

User avatar

“这北大小红书,这3D,我觉得是人类的自我膨胀,有点过分!”

User avatar

“3D生成,我猜一定是外星人来地球搞的,太搞笑了!”

User avatar

“这玩意儿,我有点迷,但感觉它要改变世界,这很厉害!”

User avatar

“3D生成?感觉时间都变慢了,这算什么,简直是未来!”

User avatar

“哈哈,这北大小红书,玩的就是心跳!真够酷的!”

User avatar

“搞什么3D,感觉我们人类都要被机器超越了,有点害怕!”

User avatar

“这3D玩意儿,简直是人类进化的一大步!太牛逼了!”

睡觉动画