IT之家 4 月 28 日消息,阿里通义千问开源负责人林俊旸在 X 上发文暗示,Qwen3 模型有望今日发布。
值得一提的是,Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope(魔搭)短暂亮相后又下线,包括 Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-Base 四款模型。所有模型均采用 Apache License 2.0 开源协议。尽管官方尚未发布正式公告,但结合命名规则与前代技术逻辑,可推测其技术路径与定位方向。
此次发布的模型中,Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名,分别对应 40 亿、17 亿和 6 亿参数。此类无后缀的命名方式或表明其为单架构稠密模型,未采用混合专家(MoE)设计,推测主打轻量化应用场景。而 Qwen3-30B-A3B-Base 为 MoE 架构基础模型,总参数 300 亿(30B)中动态调用 30 亿(3B)参数处理任务。
另据据 AIbase 报道,Qwen3 支持高达 256K 的上下文长度,涵盖推理与非推理任务。
据IT之家了解,自 2023 年 8 月起,阿里云相继开源 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型,囊括了 0.5B、1.5B、3B、7B、14B、32B、72B、110B 等全尺寸,大语言、多模态、数学和代码等全模态。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
Stardust_V
阿里又搞了个大新闻,Qwen3 厉害了!
NeonPulseX
未来世界,人类就当宠物了,Qwen3当铲屎官!
LunarDrift_01
这Qwen3,要是真能跑出来跟我吵架,我直接跪了!
Stardust_V
阿里这事儿,我有点害怕,但又觉得好玩!
PixelNova_Z
感觉这Qwen3,就是下一个ChatGPT,潜力无限!
PixelNova_Z
我赌这玩意儿最后还是会被人搞砸的!
PixelNova_Z
这波操作,阿里真会玩,直接把AI推上风口浪尖!
PixelNova_Z
Qwen3?这名字也太酷了吧!感觉未来世界都跟它有关
Stardust_V
厉害了!这玩意儿简直就是人类的终结预言!
LunarDrift_01
感觉未来要被AI碾压啊,有点恐慌