Midjourney操作界面

​谷歌计划将 Gemini 与 Veo AI 模型结合,推动智能助手发展

在近日的一档播客节目中,谷歌 DeepMind 的首席执行官米斯・哈萨比斯(Demis Hassabis)表示,谷歌计划最终将其 Gemini 人工智能模型与视频生成模型 Veo 结合,以提升 Gemini 对物理世界的理解。他指出,Gemini 从一开始就是为了多模态设计的,目的是实现一个 “通用数字助手”,这种助手能够在现实世界中真正帮助用户。哈萨比斯提到,AI 行业正逐渐朝着 “全能” 模型

在近日的一档播客节目中,谷歌 DeepMind 的首席执行官米斯・哈萨比斯(Demis Hassabis)表示,谷歌计划最终将其 Gemini 人工智能模型与视频生成模型 Veo 结合,以提升 Gemini 对物理世界的理解。他指出,Gemini 从一开始就是为了多模态设计的,目的是实现一个 “通用数字助手”,这种助手能够在现实世界中真正帮助用户。

谷歌大模型Gemini

哈萨比斯提到,AI 行业正逐渐朝着 “全能” 模型的方向发展,这些模型能够理解和合成多种媒体形式。例如,谷歌最新的 Gemini 模型不仅可以生成文本和图像,还能生成音频。而 OpenAI 在 ChatGPT 中的默认模型也已经能够原生创建图像。此外,亚马逊也宣布将在今年推出一款 “任何到任何” 的模型。

实现这些全能模型需要大量的训练数据,包括图像、视频、音频和文本等。哈萨比斯暗示,Veo 模型的训练数据主要来自谷歌拥有的 YouTube 平台。他表示,通过观看大量 YouTube 视频,Veo2能够学习到世界的物理规律。

谷歌此前曾表示,其模型 “可能” 会根据与 YouTube 创作者的协议,从 “部分” YouTube 内容中进行训练。报告显示,谷歌去年扩展了其服务条款,以便能够获取更多数据来训练其人工智能模型。这一策略表明,谷歌正在积极寻求提高其 AI 技术的能力,以满足市场需求。

随着人工智能技术的快速发展,谷歌的这一计划也反映了业界对多模态 AI 的重视和未来可能的发展方向。结合 Gemini 和 Veo 的模型,将有助于为用户提供更丰富的互动体验,使人工智能能够更好地融入日常生活中。

划重点:

- 🤖 谷歌计划将 Gemini 与 Veo AI 模型结合,以提升对物理世界的理解。

- 🎥 Veo 模型的训练数据主要来自 YouTube,利用大量视频学习物理规律。

- 🌐 AI 行业正在向多模态 “全能” 模型发展,以满足日益增长的市场需求。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部