智能体榜第一，纳米 AI 凭什么

11482点击 2025-07-24 11:03

智能体榜第一，纳米 AI 凭什么

AI 解放生产力的奇点，可能就在 2025 年。

「2025 年会成为智能体爆发的一年」这一判断基本已经成为了行业内的共识。这一点从第三方机构 aicpb AI 产品榜的变化就可以看出。在 6 月份最新发布的 AI 产品榜上，aicpb 首次增加了智能体榜单。

令人意外的是，排名第一的并非此前大火的 Manus，也不是来自老牌搜索厂商百度，或是号称 All in AI 的字节跳动，而是 360 旗下的纳米 AI。其 156.67M 的月度 Web 访问量甚至断层式领先了第二名 Manus 近 10 倍。

智能体榜第一，纳米 AI 凭什么

要知道，此时距离纳米 AI 超级搜索正式发布还不到一个月。纳米 AI 超级搜索是如何做到异军突起的？

智能体时代：让 AI 从「给你答案」

变成了「交付结果」

当我们从网上获取信息时，大多数人脑海中浮现的仍然是那个熟悉的画面：输入关键词，获得一串链接，然后再自己手动分析、筛选、整理，时常还找不到想要的答案。

这是传统搜索引擎时代。关键词稍有不同，显示出来的结果也大相径庭，也就无法真正理解用户的需求。同时，因为竞价排名的广告模式，内容总是被点击率所裹挟，很多所谓「标题党」的信息往往排名更靠前，信息需要用户筛选掉大量无关信息。

ChatGPT 的出现改写了这种信息获取的方式。用户可以直接获得一个相对精准的结果，获取信息的方式从「检索、遍历」进化到了「直接获取结果」。

智能体的出现，标志着 AI 生产力落地的又一次范式转化。智能体带来的最大变革，是让 AI 从「给你答案」变成了「交付结果」。系统不再只是给出一个答案，而是可以自动调用工具执行用户的复杂需求，直接给出一个交付结果。例如输入「优化公司财报」，它不再是教你怎么做，而是直接生成一份专业的财报优化方案。

智能体榜第一，纳米 AI 凭什么

AI 智能体、AI 助理、聊天机器人的区别

具体而言，一个合格的智能体通常需要具备以下特征：

1、自主性：在最小人工干预下独立运行，具备自我驱动的执行能力。

2、环境感知：通过多种接口实时获取环境状态信息，并理解上下文变化。

3、推理规划：基于目标进行任务分解，制定多步骤执行策略和资源分配方案。

4、适应学习：从执行反馈中提取经验，动态调整行为模式和决策策略。

5、工具集成：主动选择和组合外部工具/API，扩展自身能力边界。

6、状态管理：维护短期工作记忆和长期知识存储，支持上下文连续性。

7、目标导向：围绕明确目标进行行为选择，具备结果评估和纠偏能力。

8、多模态交互：支持自然语言、API 调用等多种交互方式，具备协作能力。

一句话总结就是，真正的智能体应该具备「感知→推理→规划→执行→反馈→优化」的完整闭环能力，而不仅仅是高级版本的问答系统。

整体而言，智能体目前仍处于早期阶段。海外市场方面，巨头如微软、谷歌、OpenAI 都在开发自己的智能体产品，例如 OpenAI 最近推出的 ChatGPTAgent，大致覆盖了上述特征。而在与大家更相关的国内市场，manus 和纳米 AI 可以说是跟进最早的玩家。

两个场景，看懂纳米 AI 的能力

为了更好地理解纳米 AI 智能体的能力，我们挑选了两个典型的用户场景。

首先是「一句话生成长视频」，例如告诉纳米 AI，让它生成一条上海城市的宣传片。

智能体榜第一，纳米 AI 凭什么

「一句话生成长视频」过程

面对这样一个复杂任务，纳米 AI 其实把整个流程拆解成了「输入信息、整理文案、生成分镜脚本、文生图、配音、图生视频、添加配音字幕、视频拼接、获取 BGM、添加 BGM」等环节。

每个任务由不同的智能体完成，整个视频是一个多智能体组成的工作流。看起来用户只说了一句话就得到了一个视频，但实际上支撑纳米 AI 完成这个复杂需求的是个智能体团队。

例如在最开始的信息检索阶段，就调用了超级搜索智能体，检索出了 30 个搜索结果，并以此为基础形成了这支上海城市宣传片的文案和分镜脚本部分。

智能体榜第一，纳米 AI 凭什么

纳米 AI 生成的分镜脚本（部分），可以看到很好的把握了上海的代表性元素

以分镜脚本为基础，纳米 AI 又调用了图片生成智能体，形成了多个上海的代表性画面作为分镜图片。

智能体榜第一，纳米 AI 凭什么

纳米 AI 调用文生图智能体

值得注意的是，纳米 AI 最终产出的视频长达两分钟，一条视频能消耗 1000 万左右 token，以 AI 生成视频的标准来说这个长度相当夸张。业界具备类似长任务的执行能力的智能体非常少。同时，它有连贯的逻辑以及接近摄影实拍的视频画面，配音、BGM、字幕这些正常视频的各种要素也全都具备。即使拿「人类作者」的标准看待，这也是一个相当成熟的视频。

智能体榜第一，纳米 AI 凭什么

过去制作一条视频，往往要经过「文案-分镜-拍摄/绘图-剪辑-后期」这样一整套工作，涉及策划、美术师、剪辑师等，不同工种耗费数个工作日才能协作完成。

但是现在，泡一杯咖啡的时间，纳米 AI 就能生成一个成熟的长视频。AI 生成视频，在此刻真正做到了有用。

另一个场景是处理复杂的研究型问题，以「分析人工智能对就业市场的影响」为例。

智能体榜第一，纳米 AI 凭什么

纳米 AI 深度研究过程

令人惊讶的是，在输入需求之后，纳米 AI 并没有一味执行任务，而是主动要求进一步补充需求的具体细节。这体现了纳米 AI 的「搜商」，能够像人类一样在思考，主动发起交互、补足思维链。

智能体榜第一，纳米 AI 凭什么

纳米 AI 主动要求明确需求

在生成结果的关键节点，纳米 AI 也会主动发起询问，以更好地匹配用户需求。这份提纲包含了现状分析、趋势预测、政策建议、和最后的结论，从结构上来说，十分完整。

智能体榜第一，纳米 AI 凭什么

最终，纳米 AI 超级搜索在十几分钟内就生成了一份包含数据图表、趋势分析、政策建议的综合报告。

过去，研究者需要从多个信息源收集资料，然后进行人工分析和整合，往往要耗费几天甚至几周的时间。而现在，在短时间内，所有人就能快速了解一个复杂问题的基本面貌。

智能体榜第一，纳米 AI 凭什么

报告不仅是文字，也包含图表、图片等多模态信息

不仅如此，这份最终生成的报告还可以转换成 PDF、Word、思维导图、PPT，甚至是动态网页，形成了从资料搜索、生成分析到结果演示的完整闭环。

智能体榜第一，纳米 AI 凭什么

纳米 AI 生成的动态网页

值得注意的是，纳米 AI 在报告最后还列出了 36 个参考文献的链接。对于复杂的研究型问题而言，这一点非常有必要，研究者可以很方便地作进一步的研究和查证。

智能体榜第一，纳米 AI 凭什么

纳米 AI 列出的参考文献链接（部分）

在整个生成研究的过程中，纳米 AI 自主跑完了一整个流程，直接完成了交付。甚至在用户需求不明确时，它还会主动发起交互，补足思维链。从 AI 2.0 时代的「告诉你怎么做」，到纳米 AI 的「直接交付多模态的结果」，这是一整套范式的转变。

实际上，要让 AI 自主完成一件复杂任务并不是一件容易的事，背后有非常复杂的对技术路径的先验思考和巨大的技术投入。

其中，多模型协作架构是纳米 AI 最令人印象深刻的技术特点之一。纳米 AI 接入了 80 多个模型，并根据不同任务需求进行智能调度。

正是有了这样的模型基座能力，才实现复杂任务下的超长思维链。

纳米 AI 在 MCP（Model Context Protocol）工具生态建设上也投入了大量资源，专为国内环境自研了许多 MCP。有人把 MCP 比作大模型的 USB-C 接口。正如 USB 标准化了硬件接口，MCP 也为大模型的标准化接口，使得其能够连接到各种外部数据源和工具，解决了「AI 可用」的问题。

目前纳米 AI 已接入 110+工具，覆盖办公协作、学术研究、生活服务、搜索引擎、金融分析、媒体娱乐、数据抓取等多个领域。在上文的「一句话生成长视频」中，比如文案生成智能体，就调用了 AI 搜索、图片转文字、音视频转文本、 AI 文档分析等多个MCP 工具。

纳米 AI 智能体还实现了对本地浏览器的调用能力，可以识别网页上的所有的可点击元素，让大模型像人一样去操作浏览器。

这么做的好处是什么呢？

信息孤岛的问题就被解决了。这是个由来已久的问题，各家互联网公司出于商业考量，并不允许谷歌、百度这类搜索引擎抓取信息。但是有了对浏览器的调用能力之后，它就可以像普通用户一样「正常访问」这些平台，获取其内部的深度信息和实时数据。

拥有了这样的能力，纳米 AI 就可以深度挖掘小红书的旅行攻略和购买建议；直接对比多个电商平台的商品，找到最低价；或者是获取社交媒体上的最新趋势和用户反馈。

智能体榜第一，纳米 AI 凭什么

纳米 AI 突破信息孤岛，检索小红书内容，生成选购建议

AI 下半场，加速 AI 效用的生产落地

LnData 的报告指出，2024 年底全球智能体市场规模已突破 500 亿美元，年度增长率超过 200%。头豹研究院对智能体的增长也持乐观态度。它预测，智能体行业市场规模将从 2024 年的 695.28 亿人民币增长至 2028 年的 8520.35 亿人民币，年复合增长率高达 87.10%。

如此巨大的市场潜力，自然吸引了 OpenAI、谷歌、微软等科技巨头，以及字节跳动、阿里、腾讯、百度等国内大厂的全面加码。

就在 7 月 17 日深夜，OpenAI 正式发布了 ChatGPT Agent，这个被业界期待已久的智能体终于姗姗来迟。和 ChatGPT 初次发布的那种惊艳不同，舆论对 ChatGPT Agent 有些两极分化。

支持者认为这标志着 AI 从「对话式 AI」向「任务执行型 AI」的转变。

反对者则认为 ChatGPT Agent 的发布更像一次「补课」而非「创新」，因为其展示的核心能力，例如多步骤任务规划、工具调用、上下文记忆，这些在国内已经不是什么新鲜事了——Manus 和纳米 AI 早在几个月前就已经实现了类似的功能。在某些方面，例如可视化生成，纳米 AI 甚至展现出了比 ChatGPT Agent 更好的能力。

整体而言，ChatGPT Agent 确实没有表现出超越国内智能体的能力。这其实反映了一个更深层的问题：AI 领域的技术护城河正在快速缩小。OpenAI 的生态整合能力和产品化水平依然值得学习，但纯粹从智能体能力来看，国内外的差距确实在快速缩小，某些细分领域甚至已经出现了反超。

智能体的终局尚未可知，但是在特定领域逐步发挥作用、成为提升工作效率的重要工具，的确是一条可预见的迭代路径。真正的挑战在于如何找到合适的应用场景，构建可持续的商业模式，并在技术创新和用户需求之间找到平衡点。毕竟，技术再牛，用户不买单也是白搭。

在 AI 下半场的激烈竞争中，纳米 AI 走出了一条独特的差异化路线——它没有选择与巨头们正面硬刚通用型超级智能体，而是选择成为智能体生态繁荣的基础设施搭建者。

周鸿祎对纳米 AI 的愿景很明确——将纳米 AI 打造成最大的「智能体社区」。

从数量上看，纳米 AI 目前已经拥有近万个专业智能体，覆盖不同行业和场景的业务需求。用户面对具体问题时，只需输入需求描述，平台即可匹配对应的专业智能体，实现从需求到解决方案的快速连接。

平台的价值不仅在于丰富的智能体资源，更在于其灵活的组合能力。在纳米 AI，如果你的任务需求过于复杂，用户还可以调用多个智能体、组建多个智能体协作的团队，通过任务分解和流程优化，实现更高效的问题解决。这种团队化协作模式，为个人和小团队提供了以往只有大企业才能享有的专业服务能力。

如果多智能体协作还不能解决你的问题，纳米 AI 的「360 智能体工厂」，还提供了低门槛的智能体搭建平台。通过自然语言交互，用户无需编程技能即可创建符合特定需求的智能体。这种零代码创建方式，让智能体的定制化变得简单高效，真正实现了「人人都能造专家」的愿景。

周鸿祎表示，AI 时代为每个人、每个组织都带来了前所未有的机遇，每个人都可以拥有三五十个智能体，形成自己的专家队伍，这些智能体听你指挥，替你干活，每个人都有机会成为超级个体。

AI 下半场，叙事逻辑从技术炫技逐步走向「效用落地」，从追求技术先进性转向追求解决问题的有效性，这才是 AI 的价值回归，真正变成普通人的生产力工具。

纳米 AI 在榜单上的排名可以视作是一个阶段性的成果。断层领先第二名近 10 倍，这并非偶然，背后反映的是使用智能体这一产品形态的强烈市场需求。

当所有人都在谈论 AGI 的终极目标时，纳米 AI 已经在实际应用中交出了答案：AI 的价值不在于有多「智能」，而在于能为多少人解决多少问题。

可以预见，智能体这场战役并不好打，但纳米 AI 已经早早入局，并握了一副好牌。

文章来自公众号“极客公园”，作者“一涛”

AI新闻纳米AI 智能体第一智能体排行榜

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务，包括网页浏览，文件操作，写代码等。OpenManus 使用了传统的 ReAct 的模式，这样的优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理。需要注意，Manus 有使用 Plan 进行规划。
项目地址：https://github.com/mannaandpoem/OpenManus

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/