AI热点 1 weeks ago 129 Views 0 Comments

通义更新Qwen3-30B-A3B:3B 激活参数媲美GPT-4o ,引发社区好评!

AI-GitHub

Published 12 Articles

阿里通义千问团队近日推出全新模型
Qwen3-30B-A3B-Instruct-2507,凭借多项技术创新与性能突破引发行业震动。

这一开源模型在仅激活3.3B参数的轻量级架构下,实现与GPT-4o、Gemini 2.5-Flash等闭源巨头的性能对标,甚至在数学推理与代码生成等核心任务中实现反超。

更令人惊喜的是,新模型在多个基准测试中基本追平甚至超越了DeepSeek-V3-0324等模型。下图对比了新版本与DeepSeek-V3-0324的性能结果,突显其在效率优化上的优势。

关键能力升级


Qwen3-30B-A3B-Instruct-2507在多个维度实现了关键提升:

通用能力大幅增强:包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

多语言知识覆盖进步:显著提升了长尾知识的处理能力。

用户偏好对齐优化:在主观和开放任务中生成更高质量的文本,提供更有帮助的回答。

长文本理解扩展:支持高达256K的上下文长度。

网友好评:

这款新模型就像Qwen团队说的:“更轻、更强、更好用!”

于是引发网友感叹模型计算效率的提升速度。

开源力量迅速发酵,社区推出了量化版本和更多使用渠道,降低了运行门槛。

也有开发者分享了在Mac电脑、搭载RTX 3090的PC等设备上的运行体验,证明了其消费级硬件的友好性。

Qwen3-30B-A3B的出现,让大家在消费级GPU上运行AI模型有了新的选择。


Qwen3-30B-A3B-Instruct-2507已在ModelScope与Hugging Face全面开源(Apache 2.0协议)。

它不仅验证了“小激活参数,大性能输出”的技术路径,更以262K上下文与多语言长尾优化树立工业级应用新标准!

开源地址:
https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507

#AI开源项目推荐##github##AI技术##通义千问##AI模型#

AI-GitHub

AI-GitHub

12 Articles 1724 Views 0 Fans

Comment (0)

睡觉动画