智通财经APP获悉,继Qwen3.6-Plus发布之后,阿里巴巴(09988)千问大模型团队分享下一代旗舰模型的早期预览版:Qwen3.6-Max-Preview相比Qwen3.6-Plus,本次预览版带来了更强的世界知识和指令遵循能力,以及在多项基准上显著提升的智能体编程表现。作为预览版,模型仍在积极迭代中,后续版本将持续优化。Qwen3.6-Max-Preview主要特性包括:相比Qwen3.6-Plus显著提升的智能体编程能力;更强的世界知识和指令遵循;更优的真实场景智能体与知识可靠性表现。

模型性能

以下展示了 Qwen3.6-Max-Preview 与主流前沿模型的评测对比。相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升(如 SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8),世界知识更强(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更优(ToolcallFormatIFBench +2.8)。在权威三方评测Artificial Analysis刚刚更新的大模型榜单中,Qwen3.6-Max-Preview性能表现超过GLM5.1、MiniMax-M2.7等模型,登顶最佳国产模型。


开始使用Qwen3.6-Max-Preview

Qwen3.6-Max-Preview将通过阿里云百炼 API 提供,模型名称为 qwen3.6-max-preview。您也可以在 Qwen Studio 上即时体验。

API更新

阿里云百炼支持行业标准协议,兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。

本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。

总结

Qwen3.6-Max-Preview 是千问大模型下一代旗舰模型的早期预览版,在智能体编程、世界知识和指令遵循方面相比 Qwen3.6-Plus 均有显著提升。它在六项主要编程基准上取得最高分——SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode——相比前代有大幅进步。同时在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。

作为预览版,Qwen3.6-Max-Preview仍在积极开发中。千问大模型团队将持续迭代模型,后续版本将带来进一步提升。

目前,千问3.6系列已推出Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash,并开源Qwen3.6-35B-A3B。其中,Qwen3.6-Plus登顶全球最大的三方API调用平台OpenRouter的日榜、周榜、趋势榜冠军,Qwen3.6-35B-A3B则登顶HuggingFace全球开源大模型榜单冠军,千问3.6成为当下最受企业和开发者欢迎的大模型。