(原标题:阿里千问推出开源权重语言模型Qwen3-Coder-Next)
智通财经APP获悉,2月4日,阿里千问推出 Qwen3-Coder-Next,一款专为编程智能体与本地开发设计的开源权重语言模型。该模型基于
Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE
的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。
据介绍,Qwen3-Coder-Next 不依赖单纯的参数扩展,而是聚焦于扩展智能体训练信号。阿里千问使用大规模的可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括:在以代码与智能体为中心的数据上进行持续预训练;在包含高质量智能体轨迹的数据上进行监督微调;领域专精的专家训练(如软件工程、QA、Web/UX 等);将专家能力蒸馏到单一、可部署的模型中。
该配方强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。
