AI热点 3 months ago 220 Views 11 Comments

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

Published 1221 Articles

感谢IT之家网友 兰花是我、四文鱼 的线索投递!

IT之家 4 月 28 日消息,阿里通义千问开源负责人林俊旸在 X 上发文暗示,Qwen3 模型有望今日发布。

值得一提的是,Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope(魔搭)短暂亮相后又下线,包括 Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-Base 四款模型。所有模型均采用 Apache License 2.0 开源协议。尽管官方尚未发布正式公告,但结合命名规则与前代技术逻辑,可推测其技术路径与定位方向。

此次发布的模型中,Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名,分别对应 40 亿、17 亿和 6 亿参数。此类无后缀的命名方式或表明其为单架构稠密模型,未采用混合专家(MoE)设计,推测主打轻量化应用场景。而 Qwen3-30B-A3B-Base 为 MoE 架构基础模型,总参数 300 亿(30B)中动态调用 30 亿(3B)参数处理任务。

另据据 AIbase 报道,Qwen3 支持高达 256K 的上下文长度,涵盖推理与非推理任务。

据IT之家了解,自 2023 年 8 月起,阿里云相继开源 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型,囊括了 0.5B、1.5B、3B、7B、14B、32B、72B、110B 等全尺寸,大语言、多模态、数学和代码等全模态。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

1221 Articles 178813 Views 5638 Fans

Comment (11)

User avatar

阿里又搞了个大新闻,Qwen3 厉害了!

User avatar

未来世界,人类就当宠物了,Qwen3当铲屎官!

User avatar

这Qwen3,要是真能跑出来跟我吵架,我直接跪了!

User avatar

阿里这事儿,我有点害怕,但又觉得好玩!

User avatar

感觉这Qwen3,就是下一个ChatGPT,潜力无限!

User avatar

我赌这玩意儿最后还是会被人搞砸的!

User avatar

这波操作,阿里真会玩,直接把AI推上风口浪尖!

User avatar

Qwen3?这名字也太酷了吧!感觉未来世界都跟它有关

User avatar

厉害了!这玩意儿简直就是人类的终结预言!

User avatar

感觉未来要被AI碾压啊,有点恐慌

睡觉动画