Qwen3
阿里巴巴 Qwen(通义千问)系列第三代旗舰开源大模型(2025-04 发布),覆盖 dense 0.6B 到 235B MoE 多档,是中国开源大模型生态的"事实标准"基础模型之一,下载量与社区生态规模全球前列。
关键规格
| 版本 | 参数 | 备注 |
|---|---|---|
| Qwen3-0.6B / 1.7B / 4B / 8B / 14B / 32B | dense | 端到端覆盖 |
| Qwen3-30B-A3B | MoE 30B/3B 激活 | 小型 MoE 主力 |
| Qwen3-235B-A22B | MoE 235B/22B 激活 | 旗舰 |
| 模态 | 文本(多模态由 Qwen2-VL 系列负责) | |
| 上下文 | 32K~128K tokens | |
| 许可证 | Apache 2.0(最宽松) | |
| 思考模式 | 支持开关 thinking mode(类似 o1) |
市场定位
Qwen3 关键定位:
- 中国最强开源大模型之一 —— 与 DeepSeek V3 并列国产开源双旗舰
- 覆盖最全 —— 0.6B 到 235B 全档 SKU,端云通吃
- 思考模式可切换 —— 单一模型支持开/关 reasoning,类似 GPT-5 思路
- 国际声誉 —— HuggingFace 排行榜常驻第一档
客户与部署
- 阿里云 DashScope / Bailian / PAI —— 阿里云 AI 主力产品
- 企业自部署 —— Apache 2.0 商业完全自由
- 国内 AI 创业公司 —— 大量基于 Qwen3 二次开发
- HuggingFace 社区 —— 全球下载量长期前三
演进路线
Qwen 1(2023-08)→ Qwen 1.5 / Qwen 2 / Qwen 2.5(2024)→ Qwen3(2025-04)→ Qwen3-VL / Qwen3-Coder 等专门版 → Qwen 4(路线图)
关键来源
- 4-02-模型工厂 —— 国产开源大模型生态
关联
↑ up::阿里巴巴 阿里云 ↓ down::阿里云 4-04-模型部署与优化 5-04-AI编程助手 ⚔ competitor::DeepSeek V3 Llama 4 GPT-5 豆包1.5 ∈ belongs_to::4-02-模型工厂