阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

9255点击 2026-02-04 17:31

个人电脑也能跑出顶级编程智能体？

智东西2月4日报道，今日凌晨，阿里开源了一款小型混合专家模型Qwen3-Coder-Next，专为编程智能体（Agent）和本地开发打造。

该模型总参数80B，激活参数仅3B，在权威基准SWE-Bench Verified上实现了超70%的问题解决率，性能媲美激活参数规模大10-20倍的稠密模型。

Qwen3-Coder-Next的主要增强功能如下：

1、高效MoE架构：仅需激活3B参数，可达到与激活参数数量高出10-20倍的模型相当的性能，包括37B激活参数的DeepSeek-V3.2、32B激活参数的Kimi K2.5等，降低显存与算力需求。

2、更强智能体能力：擅长长段推理、复杂工具使用以及从执行失败中恢复，在动态编程任务中性能强大。

3、与真实世界的IDE多样化集成：其256k的上下文长度，加上对各种脚手架模板的适应性，使其能够与OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等不同的CLI/IDE平台无缝集成，支持多样化的开发环境。

Qwen3-Coder-Next在实际开发中能理解需求、编写代码，还能与环境交互、完成任务，可以在没有人工干预的情况下生成可玩的网页游戏，部署服务并自动测试。

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

▲用Qwen3-Coder-Next在Cline上创建彩色动画Demo

阿里在编程智能体上进展不断。就在昨日，阿里云CTO周靖人、阿里千问大模型技术负责人林俊旸署名的论文在Arxiv平台上发表，为推进下一代编程Agent的发展提供了新资源和可靠方法。

简单来说，他们提出了一个可扩展的高效框架SWE-Universe，用于从GitHub拉取请求自动构建真实世界的软件工程（SWE）可验证环境。利用一个构建Agent，团队将真实世界的多语言SWE环境的数量扩展到接近百万级（807693个）。最后，团队将该技术应用于Qwen3-Max-Thinking，并在SWE-Bench Verified测试中取得了75.3%的高分。

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

▲论文截图

论文地址：

https://www.arxiv.org/abs/2602.02361

回到本次面向产业推出的新模型来看，团队已正式开源Qwen3-Coder-Next（Base）与Qwen3-Coder-Next（Instruct）两个版本，支持研究、评测及商业应用多种场景。

Qwen3-Coder-Next一经发布引起了广泛关注，有网友在社交平台X上称这一模型“尺寸完美”，也有网友表示自己等便携版的Qwen3-Coder已经很久了。

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

▲社交平台X网友对Qwen3-Coder-Next模型的部分评论

魔搭社区地址：

https://www.modelscope.cn/collections/Qwen/Qwen3-Coder-Next

Hugging Face地址：

https://huggingface.co/collections/Qwen/qwen3-coder-next

GitHub地址：

https://github.com/QwenLM/Qwen3-Coder

技术报告地址：

https://qwen.ai/blog?id=qwen3-coder-next

01. 实测看齐10-20倍激活参数模型

赶超DeepSeek-V3.2

尽管激活参数规模很小，Qwen3-Coder-Next在多项智能体评测上仍能匹敌或超过若干更大的开源模型。

该模型在SWE-Bench、TerminalBench 2.0和Aider等多个主流编程智能体基准上的表现如下。

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

▲Qwen3-Coder-Next实测表现

使用SWE-Agent框架时，Qwen3-Coder-Next在SWE-Bench Verified上达到70%以上，超过了DeepSeek-V3.2，接近GLM-4.7、MiniMax M2.1。

在多语言设置以及更具挑战的SWE-Bench-Pro基准上，Qwen3-Coder-Next同样超过了DeepSeek-V3.2，还较大幅度领先于GLM-4.7、MiniMax M2.1。

在效率方面，Qwen3-Coder-Next与同类模型在SWE-Bench-Pro基准上进行对比分析，每次推理仅激活3B参数，却能达到与激活参数量达其10-20倍的模型相当的基准性能，包括37B激活参数的DeepSeek-V3.2、32B激活参数的GLM-4.7、32B激活参数的Kimi K2.5等。

虽然专有的全注意力模型在绝对性能上仍保持领先优势，但Qwen3-Coder-Next在面向低成本智能体部署的应用场景中，仍能在效率与性能之间取得更优的帕累托权衡。

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

▲Qwen3-Coder-Next实测表现

02. 创新智能体训练配方：

强化智能体训练的信号

Qwen3-Coder-Next模型基于Qwen3-Next-80B-A3B-Base构建，采用混合注意力与MoE的新架构；通过大规模可执行任务合成、环境交互与强化学习进行智能体训练，在降低推理成本的同时，提升编程与智能体能力。

Qwen3-Coder-Next并不只依赖参数规模扩张，而是将重点放在扩展智能体训练信号（agentic training signals）上。团队使用大规模的可验证编程任务与可执行环境进行训练，让模型能够直接从环境反馈中学习，而非仅依赖静态文本。

训练过程主要包括：

1、持续预训练：在以代码与智能体为中心的大规模数据上进行。

2、监督微调：基于高质量的智能体交互轨迹，优化模型的行为。

3、领域专家训练：针对软件工程、问答、Web/UX等特定领域，精细化专家能力。

4、专家知识蒸馏：最终将27个专家的能力融合至一个轻量的、可部署的单一模型。

这套“配方”的核心目标，是教会模型长时程推理、熟练使用工具，以及从执行错误中有效恢复——这些正是实用编程智能体所需的核心能力。

03. 多样化集成下游应用

无人工干预完成游戏生成部署

Qwen3-Coder-Next的价值还体现在于其低部署门槛与应用体验。

得益于仅3B的激活参数，开发者可灵活将其集成至多种场景：作为本地IDE插件，实现自动修复与代码生成；构建命令行智能体（CLI Agent），通过自然语言操作终端、管理项目；部署于企业内网环境，打造私有化、高响应的编程辅助系统。“小激活、快响应、强能力”为编程智能体的规模化落地提供了更具可行性的路径。

该模型可集成到多种下游应用中，下文展示其在OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等场景中的示例。

1、Web Dev：创建聊天界面（Creating a Chat Interface）

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

2、CLI：桌面清理（Desktop Cleanup）

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

3、OpenClaw：创建聊天界面（Creating a Chat Interface）

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

4、Browser Use Agent：在亚马逊上搜索商品（Searching for a Product on Amazon）

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

5、coder.qwen.ai：开发一个五子棋游戏（Building a Gomoku Game）

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

04. 结语：研发落地双投入

阿里加码编程智能体

编程智能体正成为阿里千问团队的强攻领域。Qwen3-Coder-Next在编程智能体基准上表现强劲，展现了技术在实用场景中的应用价值。而周靖人、林俊旸署名的新论文则代表了其编程智能体新的前沿进展，形成了研发和落地两条路快步走的趋势。

展望未来，团队认为强大的智能体能力，如自主使用工具、应对难题、管理复杂任务，是更好编程智能体的关键。接下来团队计划提升模型的推理与决策能力、支持更多任务，并根据使用反馈快速迭代更新。

文章来自于“智东西”，作者 “李水青”。

关键词: AI新闻 , Qwen3-Coder-Next , 阿里AI , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner