AI热点 6 months ago • 141 Views • 0 Comments

通义千问Qwen3发布：推理能力显著增强支持两种思考模式

AIbase基地

AIbase基地

Published 11451 Articles

HuggingFace

HuggingFace

0 seconds ago

魔搭社区

魔搭社区

0 seconds ago

通义千问团队宣布推出Qwen3，这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色，与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比，展现了极具竞争力的结果。其中，小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%，但表现更胜一筹，而像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

此次，通义千问团队开源了两个MoE模型的权重:Qwen3-235B-A22B，一个拥有2350多亿总参数和220多亿激活参数的大模型;以及Qwen3-30B-A3B，一个拥有约300亿总参数和30亿激活参数的小型MoE模型。此外，六个Dense模型也已开源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，均在Apache2.0许可下开源。

Qwen3模型支持两种思考模式:思考模式和非思考模式。思考模式下，模型会逐步推理，经过深思熟虑后给出最终答案，适合复杂问题;非思考模式下，模型提供快速、近乎即时的响应，适用于简单问题。这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度，实现稳定且高效的“思考预算”控制能力。

Qwen3模型支持119种语言和方言，为国际应用开辟了新的可能性。在预训练方面，Qwen3的数据集相比Qwen2.5有了显著扩展，使用了约36万亿个token进行预训练，涵盖了119种语言和方言。预训练过程分为三个阶段，最终确保模型能够有效处理更长的输入。

为了开发能够同时具备思考推理和快速响应能力的混合模型，Qwen3实施了一个四阶段的训练流程，包括长思维链冷启动、长思维链强化学习、思维模式融合和通用强化学习。这一流程旨在为模型配备基本的推理能力，并进一步增强模型的通用能力。

Qwen3的发布和开源将极大地推动大型基础模型的研究与开发。通义千问团队的目标是为全球的研究人员、开发者和组织赋能，帮助他们利用这些前沿模型构建创新解决方案。

Qwen3现已在Hugging Face、ModelScope和Kaggle等平台上开放使用，用户可以轻松将其集成到研究、开发或生产环境中。

huggingface

https://huggingface.co/Qwen/Qwen3-235B-A22B

魔搭社区

https://modelscope.cn/models/Qwen/Qwen3-235B-A22B

Qwen Chat

https://chat.qwen.ai

阿里云百炼（即将上线，并提供100万tokens免费体验）

https://www.aliyun.com/product/tongyi

AIbase基地

AIbase基地

11451 Articles 2091921 Views 950300 Fans

Comment (0)

Chapter

1. GPT-4简介与注册指南

1.1 账号注册步骤

Recommended Articles

自然语言简化查找专利流程，Perplexity 推出新版 AI 检索工具

自然语言简化查找专利流程，Perplexity 推出新版 AI 检索工具

2 days ago • AI热点

大厂裁员 14000 人背后真相：AI 干不了你的活，却先砸了你的饭碗

大厂裁员 14000 人背后真相：AI 干不了你的活，却先砸了你的饭碗

2 days ago • AI热点

Sora 2上线之后，我却发现了AIGC的另一种可能性

Sora 2上线之后，我却发现了AIGC的另一种可能性

2 days ago • AI热点

刷到一个又一个假视频后，我不敢相信互联网了

刷到一个又一个假视频后，我不敢相信互联网了

2 days ago • AI热点

今天的AI基建狂潮，恰如150年前铁路狂潮的历史轮回

今天的AI基建狂潮，恰如150年前铁路狂潮的历史轮回

2 days ago • AI热点

这个双11的AI电商：热闹在入口，但核心是基建

这个双11的AI电商：热闹在入口，但核心是基建

2 days ago • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0 seconds ago • AI热点

OpenAI发布安全研究智能体：能像人类专家一样挖漏洞、写补丁

OpenAI发布安全研究智能体：能像人类专家一样挖漏洞、写补丁

2 days ago • AI热点

Popular Tags

AI绘画网站 PaddleOCR-VL AI 3D 代码生成通用图像生成聪明 AI记忆工具心理健康危机首届AI高考作文大赛猜CP

Popular Authors

AI中国

AI中国

11451 Articles 95.03万 Followers

钛媒体APP

钛媒体APP

1474 Articles 0 Followers

IT之家

IT之家

1221 Articles 5.64K Followers

人人都是产品经理

人人都是产品经理

1193 Articles 5.87万 Followers

AIbase基地

AIbase基地

1064 Articles 9.63万 Followers