AI热点 5 months ago 162 Views 11 Comments

Gemini Robotics On-Device – 谷歌推出的首个本地具身智能模型

Published 11569 Articles

Gemini Robotics On-Device是什么

Gemini Robotics On-Device是谷歌DeepMind推出的首个可在机器人本地运行的视觉-语言-动作(VLA)模型。模型具备强大的离线操作能力,能遵循自然语言指令完成精细任务,如拉开袋子、叠衣服等。模型支持多种机器人本体部署,响应延迟低,适合对延迟敏感的应用。Gemini Robotics On-Device具备快速适应新任务的能力,仅需50到100个演示样本即可学会新动作,展现出强大的泛化性能。谷歌推出Gemini Robotics SDK,助力开发者评估和部署模型,降低开发成本和风险。

Gemini Robotics On-Device的主要功能

  • 本地离线运行:Gemini Robotics On-Device能完全在机器人本地运行,无需依赖云端计算,解决网络延迟和连接不稳定的问题。让机器人在没有网络连接或网络信号弱的环境中能稳定地执行任务。
  • 遵循自然语言指令:模型能理解人类的自然语言指令。模型能处理复杂的多步骤指令,让机器人真正按照人类的意图进行操作。
  • 完成精细操作任务:支持从人形机器人到工业双臂机器人的多种机器人本体,能完成各种需要精细操作的任务,如拉开袋子、叠衣服、给午餐盒拉拉链、抽卡片、倒沙拉酱、工业级的皮带装配等。
  • 快速适应新任务:谷歌首次开放VLA模型的微调功能,开发者只需要50到100个演示样本,就能让模型适应全新的任务。即使是最复杂的任务,用不到100个样本就能达到相当高的成功率。
  • 跨平台部署:模型能迁移到完全不同的机器人平台上,如双臂Franka FR3机器人和Apptronik公司的Apollo人形机器人,展现出强大的泛化能力。

Gemini Robotics On-Device的技术原理

  • 多模态推理能力:Gemini Robotics On-Device基于Gemini 2.0的多模态推理能力,能同时处理视觉、语言和动作等多种模态的信息。基于视觉输入感知环境,理解语言指令确定任务目标,生成相应的动作完成任务。
  • 优化的模型架构:为实现本地运行,模型经过优化,减少计算资源需求,保持强大的性能。模型能在机器人设备上实现低延迟推理,确保任务的实时执行。
  • 微调功能:作为谷歌首个可供微调的VLA模型,开发者基于少量的演示样本对模型进行微调,让模型适应新的任务和环境。微调功能让模型快速学习新技能,提高机器人的适应性和灵活性。
  • 安全机制:模型基于语义安全和物理安全并重的整体安全方案。基于Live API捕获语义和内容安全问题,防止机器人执行可能带来危险或不适当的行为。与底层安全关键控制器接口,确保机器人的动作符合物理安全要求,保障机器人在执行任务时的安全性。

Gemini Robotics On-Device的项目地址

  • 项目官网:https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/

Gemini Robotics On-Device的应用场景

  • 工业制造:在工业生产线上,执行复杂装配任务,如汽车零部件组装、电子设备精细安装等,提高生产效率和质量。
  • 物流仓储:协助搬运货物、管理库存,识别货物信息按指令进行分类、堆叠,优化物流流程,减少人工错误。
  • 医疗护理:辅助医护人员进行手术器械传递、康复训练指导等工作,为患者提供精准护理,减轻医护人员工作负担。
  • 家庭服务:帮助完成家务劳动,如打扫卫生、整理物品、照顾老人和儿童等,提升生活便利性和舒适度。
  • 零售服务:在商场、超市等场所,为顾客提供商品信息查询、购物引导、货物搬运等服务,提升购物体验。

11569 Articles 2144100 Views 950300 Fans

Comment (11)

User avatar

哇,谷歌的机器人也这么聪明了!

User avatar

感觉世界快要被AI统治,这感觉...有点小激动!

User avatar

这下可就真的要被取代了,人类的地位岌岌可危!

User avatar

谷歌的机器人,这玩意儿,感觉有点像科幻小说里的情节!

User avatar

感觉世界要被算法统治,有点害怕,但又觉得有趣!

User avatar

这东西,说聪明也聪明,说恐怖也恐怖,真搞不懂!

User avatar

我总觉得,机器越来越聪明,人类有点危险!

User avatar

太酷了,感觉人类的时代要过去了,有点激动!

User avatar

谷歌的机器人?这感觉有点不对劲,有点诡异!

User avatar

简直是人类的终结预兆,有点吓人!

睡觉动画