千问Qwen旗舰预览版Qwen3.6-Max-Preview发布

文章来源：企鹅号 - 算泥社区

千问Qwen发布了下一代旗舰模型早期预览版Qwen3.6-Max-Preview，在权威评测中登顶最佳国产模型。

上周，开源的Qwen3.6-35B-A3B，仅用30亿激活参数就足以匹敌数百亿参数稠密模型。

全系新模型在Agent（智能体）编程、多模态推理与世界知识等核心维度，给出了务实的技术演进方向。

一起来看具体细节。

小参数大能量的Qwen3.6-35B-A3B

继Qwen3.6-Plus发布后，主打轻量高效的Qwen3.6-35B-A3B上周走向开源社区。

它是稀疏MoE（混合专家）模型，总参数量达到350亿，实际运行中被激活的参数仅有30亿。研发工程师用精巧的架构设计，在能效比提升上迈出了一大步。

仅靠30亿激活参数，Qwen3.6-35B-A3B在多项关键自然语言编程基准测试中，得分超越拥有270亿参数的前代稠密模型Qwen3.5-27B。

在智能体编程与推理任务上，它大幅甩开前代模型Qwen3.5-35B-A3B，并具备与Gemma4-31B等主流稠密大模型正面对抗的实力。

对算力受限又需部署高阶编程能力的开发者来说，轻量级架构提供了极具性价比的方案。

Qwen3.6原生支持多模态。基于底层架构优势，Qwen3.6-35B-A3B展现出远超自身体量的视觉感知与多模态推理能力。

在多数视觉语言基准测试中，它凭30亿激活参数，与知名大模型Claude Sonnet 4.5成绩持平，部分任务甚至实现反超。

其空间智能优势尤为突出，RefCOCO测试得分为92.0，ODInW13达到50.8。

精准的空间感知能力像给人工智能装上了明锐的眼睛，帮助机器分辨屏幕里的重叠窗格，或者识别厂房里纵横交错的管线，为实体场景落地打下基础。

旗舰预览版领跑的Qwen3.6-Max-Preview

对比此前发布的Qwen3.6-Plus，旗舰模型早期预览版Qwen3.6-Max-Preview的世界知识储备与复杂指令遵循能力显著提升，交出了十分亮眼的智能体编程成绩单。

智能体编程层面，SkillsBench得分提升9.9，SciCode提升10.8，NL2Repo提升5.0，Terminal-Bench 2.0提升3.8。模型写代码和操控终端的熟练度更高。

世界知识广度与深度上，SuperGPQA提升2.3，QwenChineseBench提升5.3。

指令遵循层面，ToolcallFormatIFBench提升2.8，模型调用外部工具的格式化输出更加严谨规范。

权威第三方评测Artificial Analysis最新榜单显示，Qwen3.6-Max-Preview综合性能超越GLM5.1与MiniMax-M2.7，登顶最佳国产模型。

参考资料：

https://qwen.ai/blog?id=qwen3.6-max-preview

相关快讯