开源项目 1 days ago 94 Views 0 Comments

阿里开源Qwen3-Next预览版!长上下文推理吞吐提升10倍!

AI-GitHub

Published 42 Articles

Qwen团队近日发布了Qwen3-Next架构的预览版:Qwen3.5的抢先预览,并率先开源了基础模型Qwen3-Next-80B-A3B-Base。

这一80B参数模型在训练成本和推理效率上实现重大突破:训练资源消耗仅为Qwen3-32B的十分之一,而长上下文推理吞吐量可达后者的十倍以上。

实测表现

案例1:AIME数学竞赛题

模型就开始飞快地列出了详细解题思路和计算过程,最终得到的答案“588”与AIME标准答案完全吻合。

案例2:用p5js创建一个可直接玩的扫雷游戏。

案例3:生成天气卡片。

性能表现

预填充阶段 (Prefill): 在4K上下文下吞吐接近Qwen3-32B的7倍;在超过32K的长上下文下,吞吐提升超过10倍。

解码阶段 (Decode): 在4K上下文下吞吐提升约4倍;在长上下文(32K+)场景中,吞吐优势仍可保持超过10倍。

Qwen3-Next-80B-A3B-Base在多项基准测试中也展现了强大的实力:

在测试中超过了闭源模型Gemini-2.5-Flash-Thinking,并在部分指标上接近Qwen最新的旗舰模型
Qwen3-235B-A22B-Thinking-2507。

Qwen3-Next-80B-A3B-Base的发布标志着大模型在效率和性能上的一次重大突破。它以十分之一的训练成本,实现了对前代标杆模型的超越,并在长上下文推理吞吐上实现了数量级的提升。

开源地址:
https://huggingface.co/Qwen/Qwen3-Next-80B-A3B-Instruct

#AI开源项目推荐##github##AI技术##AI推理模型##阿里开源#

AI-GitHub

AI-GitHub

42 Articles 6497 Views 0 Fans

Comment (0)

睡觉动画