开源项目 8月前 • 211 浏览次数 • 0 评论

阿里开源Qwen3-Next预览版！长上下文推理吞吐提升10倍！

AI-GitHub

AI-GitHub

发布了 57 文章

Qwen团队近日发布了Qwen3-Next架构的预览版：Qwen3.5的抢先预览，并率先开源了基础模型Qwen3-Next-80B-A3B-Base。

这一80B参数模型在训练成本和推理效率上实现重大突破：训练资源消耗仅为Qwen3-32B的十分之一，而长上下文推理吞吐量可达后者的十倍以上。

实测表现

案例1:AIME数学竞赛题

模型就开始飞快地列出了详细解题思路和计算过程，最终得到的答案“588”与AIME标准答案完全吻合。

案例2：用p5js创建一个可直接玩的扫雷游戏。

案例3：生成天气卡片。

性能表现

预填充阶段 (Prefill)：在4K上下文下吞吐接近Qwen3-32B的7倍；在超过32K的长上下文下，吞吐提升超过10倍。

解码阶段 (Decode)：在4K上下文下吞吐提升约4倍；在长上下文（32K+）场景中，吞吐优势仍可保持超过10倍。

Qwen3-Next-80B-A3B-Base在多项基准测试中也展现了强大的实力：

在测试中超过了闭源模型Gemini-2.5-Flash-Thinking，并在部分指标上接近Qwen最新的旗舰模型
Qwen3-235B-A22B-Thinking-2507。

Qwen3-Next-80B-A3B-Base的发布标志着大模型在效率和性能上的一次重大突破。它以十分之一的训练成本，实现了对前代标杆模型的超越，并在长上下文推理吞吐上实现了数量级的提升。

开源地址：
https://huggingface.co/Qwen/Qwen3-Next-80B-A3B-Instruct

#AI开源项目推荐##github##AI技术##AI推理模型##阿里开源#

AI-GitHub

AI-GitHub

57 文章 9880 浏览次数 0 粉丝

评论 (0)

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

6月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

6月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

6月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

7月前 • 开源项目

AI的开源战略

AI的开源战略

7月前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

7月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

7月前 • 开源项目

热门标签

AI座舱 AI 辅助网店运营模型加载服务器收入增长谷歌NotebookLM DeepSeek指令玉盘AI MaterialDesign3 厚涂即时设计

热门作者

AI中国

AI中国

11569 文章 95.03万关注

钛媒体APP

钛媒体APP

1489 文章 0 关注

IT之家

IT之家

1221 文章 5.64K 关注

人人都是产品经理

人人都是产品经理

1210 文章 5.87万关注

AIbase基地

AIbase基地

1093 文章 9.63万关注