AI热点 16 hours ago 70 Views 0 Comments

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

AI中国
AI中国

Published 7969 Articles

感谢IT之家网友 小星_14 的线索投递!

IT之家 7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507

自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:

  • 在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;

  • 在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

  • 新模型支持 256K 长文本理解,处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用

IT之家附开源地址:

https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

AI中国

AI中国

7969 Articles 1238161 Views 950300 Fans

评论 (0)

睡觉动画