IT之家 7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。
自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:
在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;
在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;
新模型支持 256K 长文本理解,处理超长上下文不费力。
Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用。
IT之家附开源地址:
https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507
https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。