AI热点 3周前 199 阅读 0 评论

谷歌最强大模型Gemini 2.5正式发布,轻量版百万tokens输入价仅0.7元

作者头像
36氪的朋友们

AI技术专栏作家 | 发布了 246 篇文章

6月19日消息,谷歌于近日宣布Gemini 2.5模型全系重磅更新,Gemini 2.5 Pro、Gemini 2.5 Flash发布正式版并进入稳定运行阶段,同时推出轻量版模型Gemini 2.5 Flash-Lite的预览版。

Gemini 2.5 Pro是谷歌目前最智能的思维模型,具备卓越的推理和编程能力,能深入理解代码库并展现多模态编程能力,支持1M+tokens上下文长度,在LOFT和MRCR长上下文任务中以128k长度实现 SOTA表现。

其在Aider Polyglot编程任务、Humanity’s Last Exam、GPQA(钻石级)、SimpleQA和FACTS Grounding事实性基准测试中均获最高分。LMArena 性价比图表显示,Gemini 2.5 Pro比 Gemini 1.5 Pro分数高出120多分,超越OpenAI、xAI、Anthropic等主流模型。不过,其数学能力略逊于OpenAI o4-mini,图像理解分数低于OpenAI o3-high。

Gemini 2.5 Flash作为混合推理模型,拥有可控的思维预算,适用于大多数复杂任务,可在质量、成本和延迟之间达到良好平衡。

Gemini 2.5 Flash - Lite是2.5系列模型中延迟、成本双低的经济高效升级版,在翻译和分类等高容量、延迟敏感的任务里表现突出。新模型缩短了首个token的获取时间,每秒token解码速度更快。它还允许通过AP 参数动态控制思考预算,“思考” 功能默认关闭,同时具备Gemini 2.5的诸多特性,包括不同预算下开启思考模式、连接谷歌搜索和代码执行等工具、多模态输入以及100万个tokens的上下文长度。

定价方面,Gemini 2.5 Pro输入价格为1.25 美元(折合人民币约8.95元)/百万tokens,输出价格为10.00 美元(折合人民币约71.6元)/百万tokens 。Gemini 2.5 Flash思考和非思考价格相同,输入价格更新为0.3 美元(折合人民币约2.15元)/ 百万tokens,输出价格为2.5 美元(折合人民币约 17.9 元)/ 百万 tokens 。

Gemini - 2.5 - Flash - Lite价格优势明显,比Gemini 2.5 Flash便宜30%—60%,输入价格为 0.1 美元(折合人民币约 0.7 元)/百万tokens,输出价格为 0.4 美元(折合人民币约 2.9 元)/百万 tokens 。

本文来自“腾讯科技”,作者:无忌,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!