GenericAgent,发出了「人生」第一条朋友圈

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GenericAgent,发出了「人生」第一条朋友圈
7957点击    2026-03-01 16:54

最近,复旦大学肖仰华教授的朋友圈引起了热议,其在研发测试的 AI 智能体通过自主学习学会了操作微信,在朋友圈发消息并与其好友在评论区自主互动。面对自然的互动,不少好友甚至开始要求 “证明你真的是肖老师,而不是他的 AI”。


GenericAgent,发出了「人生」第一条朋友圈


这种 “分不清真人与 AI” 的错觉,源于 A3 实验室(Advantage AI Agent 实验室,由深圳夸夸菁领科技有限公司与复旦大学知识工场实验室联合成立的科研团队)研发的新型智能体:GenericAgent


它不再是安装繁复、上限受限、难以迁移的传统智能体,而是下一代自组织、自学习、自进化的通用智能体,是一个拥有 “生命感”,能够在用户使用调教下快速学习与成长的数字生命。本系统自 2026 年 1 月 11 日已经开源(https://github.com/lsdefine/pc-agent-loop)。


01 自学习、自进化:AGI 的可能形态


达到 AGI 水平的智能体不应只能在预设好的脚本与工作流下执行,而是能在环境的碰撞与探索中不断学习生长,理解并交互各种复杂环境(比如社交平台),学习解决问题的有效策略,并能形成经验沉淀,进而演变成为解决问题的专家能手,演变成为善解人意的贴心助手。这种自进化特性体现在三个维度:


  • 自组织记忆:拒绝信息的简单平铺。它拥有记忆分层组织、持续精炼功能,有效提升记忆检索效率和交互稳定性,甚至能在 “过夜” 时自主整理杂乱的记忆,确保长期运行效率。(插图:记忆的组织架构)


GenericAgent,发出了「人生」第一条朋友圈


  • 自适应学习: 具备极强的环境适应性,在交互过程中会自己记住合理的步骤、策略,只会越来越 “聪明”。


GenericAgent,发出了「人生」第一条朋友圈


一回生,两回熟


  • 自主成长进步: 遇到新问题时,它会通过 “Fork” 模式尝试直接复制自己,选取多样策略,用更好的策略更新自己。在闲置时间,“探索模式” 可以自己培养未知能力,持续拓展已有能力边界。


GenericAgent,发出了「人生」第一条朋友圈


智能体自主行为分布报告,它甚至在自主行动阶段自己在网上冲浪


实现这种 “自进化” 的背后,仅仅依赖于三个简单原则:极简架构、极强执行、极致迁移。


02 极简架构:用极致工程架构实现便捷落地


极简特点体现在:“极简架构、极低开销、极简部署” 这三个角度。


  • 极简架构: 代码仅 3000 多行(核心模块仅数百行),实现了传统架构 50 多万行代码才能具备的能力,任何开发者都能轻易读懂。

> 代码量即上下文优势:全代码 ≈ 8000 tokens,占 200K 上下文的 4%。这意味着 LLM 每轮对话都能全量理解自身源码,自己就是最好的文档、社区和工程化工具。传统项目的文档 / 社区 / 测试套件是大代码库的 "生存必需品",不是优势。


  • 极低开销:团队的核心理念是 “信息密度越大,效果越好” 。


  • 通过记忆的分层索引和按需加载(用哪层读哪层),大幅压缩 System Prompt,极大地节省了 Token 开销。
  • 全部特殊 prompt + 记忆核心 加起来没别人一个 AGENTS.md 大
  • 绝不重复传输,一半的代码逻辑都在确保 “ context 中不放任何垃圾信息”,比如重复的技能定义。


  • 极简部署:从此告别智能体还要付费指导安装的窘境,有网就能装!只要有 Python+Requests 环境就能运行,真正实现了 “只要有电的地方就能进化”。


03 极强执行能力:八爪鱼般的触达与使用工具的能力


如果说自进化是 GenericAgent 的灵魂,那么 “八爪鱼” 式的工具控制力就是它强壮的触角,以保证其出色的任务完成能力。它不仅能使用工具,更能像八爪鱼一样深入系统中的每个工具,打破组合泛化的天花板。更能像八爪鱼的身体一般具有韧劲,适应不同复杂环境的交互,即便迷宫一般的软件系统也能习得其交互策略。


  • 原子工具撬动数字世界: 团队拒绝给模型提供过于臃肿的选项,仅通过 code_run(执行任意代码)、file_read/write(文件操作)、web_scan/execute_js(浏览器控制)等 9 个原子工具,便能操控整个数字世界( PC 与网络世界)。


  • 现场 “制造” 工具: 当现有工具不足以解决问题时,GenericAgent 会开启探索模式:现场安装 Python 包、现场编写脚本、现场验证方案。


GenericAgent,发出了「人生」第一条朋友圈

现场搓工具


  • 降维打击的浏览器策略: 不同于传统方案需开启全新的、未登录的浏览器实例,它通过 JS 插件直接接管你正在使用的浏览器。
  • 优势: 无需重新登录 OA 或企业微信,它能直接在你的账号权限下内容查找、表格填写、附件上传、资源下载等繁琐流程,实现真正的 “人机接力”。


GenericAgent,发出了「人生」第一条朋友圈


接管你的浏览器


04 极致的迁移:你的智能体,随你走


GenericAgent 的设计初衷就是打破软硬件的藩篱,让智能不再被禁锢在某一个特定的 “黑盒” 里。


  • 基座模型的上游: 它不挑底座模型。无论是 Claude、Gemini 还是 Kimi ,在 GenericAgent 的架构加持下,底座的能力依赖都可以被缩小,确保输出质量稳定可靠。


GenericAgent,发出了「人生」第一条朋友圈


GenericAgent,发出了「人生」第一条朋友圈


切换基础模型毫无压力


  • 极致低廉的硬件门槛: 只要有电、有网、有 Python 环境,只要任意一台普通 PC 与手机,它就能跑起来。无论你在 Windows、Mac 还是 Android 手机上,都能拥有同样的进化体验。


GenericAgent,发出了「人生」第一条朋友圈


可以用手机操控


GenericAgent,发出了「人生」第一条朋友圈


agent 用手机点奶茶


GenericAgent,发出了「人生」第一条朋友圈


也可以操控手机


  • 极致技能复用: 智能体在某台机器上习得的复杂技能可以被提炼成记忆并直接移植。这意味着一个人的调教成果,可以让千万人直接享用,极大地降低了全社会的智能成本。


GenericAgent,发出了「人生」第一条朋友圈


新的模型(kimi),新的 Agent,从未做过发送消息的任务,注入 wechat_send_sop 后迅速掌握在微信中发消息的技能


GenericAgent 只是一个开始。想看它在你的手机上 “偷偷” 点外卖或整理记忆吗?


(注:本文案所有动图均由智能体自主生成)


👉 [关注 A3 实验室,共同见证自进化智能的诞生]


文章来自微信公众号 “ 机器之心 ”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0