谷歌发布Gemini2.5Pro预览版:编码性能击败DeepSeek R1和Grok 3 Beta

AIbase基地

发布了 11569 文章

谷歌近日推出了其最新的 Gemini2.5Pro 预览版，这款被誉为 “最智能” 模型的产品，首次在3月份宣布，随后在5月份进行了升级。此次发布的预览版旨在为企业提供一个测试新应用程序或替换早期版本的机会。根据谷歌的官方博客，这一新版本在回应速度和创意上表现更佳，同时在编码和推理能力上超越了其他模型。

在5月份的 I/O 开发者大会上，谷歌透露，Gemini2.5Pro 的升级使其性能有了显著提高。谷歌 DeepMind 首席执行官德米斯・哈萨比斯（Demis Hassabis）表示，I/O 版是该公司迄今为止最好的编码模型。然而，此次的 Gemini2.5Pro Preview06-05Thinking 比 I/O 版更为出色，已准备好满足企业级应用的需求。

新版本的 Gemini2.5Pro 在性能测试中表现优异，相较于早期版本，LMArena 测试分数提高了24分，WebDevArena 则提升了35分，当前在排行榜上名列前茅。谷歌的基准测试显示，该模型在编码能力上超过了 OpenAI 的 o3、o3-mini、o4-mini，Anthropic 的 Claude4Opus，以及 xAI 的 Grok3Beta 和 DeepSeek R1等竞争对手。

谷歌在其博客中指出，他们已根据前期版本的反馈，改进了 Gemini2.5Pro 的风格和结构，使其在回应上更具创意且格式更加规范。尽管谷歌在不断改进 Gemini2.5Pro，但这对许多用户来说可能会造成一定困惑。新版本的定价为每百万个 tokens $1.25（不含输入缓存），输出价格为 $10。

自3月份 Gemini2.5Pro 首次发布以来，这款模型已被广泛集成到许多新应用和服务中，包括 “Deep Think”，该功能使 Gemini 在回应前可以考虑多个假设。在 Gemini2.5Pro 及其两次升级版本发布后，谷歌重新在大型语言模型市场上占据了一席之地，此前的市场注意力更多地集中在 DeepSeek 和 OpenAI 等竞争对手的推理模型上。

在更新发布的短短几小时内，开发者们已经开始探索这一新版本。虽然许多人认为更新确实如谷歌所承诺的那样更快，但关于 Gemini2.5Pro 的实际性能提升尚需进一步验证。

划重点:
🌟 谷歌推出了新的 Gemini2.5Pro 预览版，声称在编码性能上超越了主要竞争对手。
🚀 新版本在多个性能测试中得分大幅提升，特别是在 LMArena 和 WebDevArena 中表现突出。
💰 定价信息为每百万 tokens $1.25，输出价格为 $10，企业可以在 Google AI Studio 和 Vertex AI 平台上使用该模型。