谷歌最强大模型Gemini 2.5正式发布，轻量版百万tokens输入价仅0.7元

36氪的朋友们

Published 11569 Articles

6月19日消息，谷歌于近日宣布Gemini 2.5模型全系重磅更新，Gemini 2.5 Pro、Gemini 2.5 Flash发布正式版并进入稳定运行阶段，同时推出轻量版模型Gemini 2.5 Flash-Lite的预览版。

Gemini 2.5 Pro是谷歌目前最智能的思维模型，具备卓越的推理和编程能力，能深入理解代码库并展现多模态编程能力，支持1M+tokens上下文长度，在LOFT和MRCR长上下文任务中以128k长度实现 SOTA表现。

其在Aider Polyglot编程任务、Humanity’s Last Exam、GPQA（钻石级）、SimpleQA和FACTS Grounding事实性基准测试中均获最高分。LMArena 性价比图表显示，Gemini 2.5 Pro比 Gemini 1.5 Pro分数高出120多分，超越OpenAI、xAI、Anthropic等主流模型。不过，其数学能力略逊于OpenAI o4-mini，图像理解分数低于OpenAI o3-high。

Gemini 2.5 Flash作为混合推理模型，拥有可控的思维预算，适用于大多数复杂任务，可在质量、成本和延迟之间达到良好平衡。

Gemini 2.5 Flash - Lite是2.5系列模型中延迟、成本双低的经济高效升级版，在翻译和分类等高容量、延迟敏感的任务里表现突出。新模型缩短了首个token的获取时间，每秒token解码速度更快。它还允许通过AP 参数动态控制思考预算，“思考” 功能默认关闭，同时具备Gemini 2.5的诸多特性，包括不同预算下开启思考模式、连接谷歌搜索和代码执行等工具、多模态输入以及100万个tokens的上下文长度。

定价方面，Gemini 2.5 Pro输入价格为1.25 美元（折合人民币约8.95元）/百万tokens，输出价格为10.00 美元（折合人民币约71.6元）/百万tokens 。Gemini 2.5 Flash思考和非思考价格相同，输入价格更新为0.3 美元（折合人民币约2.15元）/ 百万tokens，输出价格为2.5 美元（折合人民币约 17.9 元）/ 百万 tokens 。

Gemini - 2.5 - Flash - Lite价格优势明显，比Gemini 2.5 Flash便宜30%—60%，输入价格为 0.1 美元（折合人民币约 0.7 元）/百万tokens，输出价格为 0.4 美元（折合人民币约 2.9 元）/百万 tokens 。

本文来自“腾讯科技”，作者：无忌，36氪经授权发布。