Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞
8922点击    2026-01-29 14:57

近日,香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索,只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作,还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”,甚至发明了一套只有它们才懂的秘密语言。


他告诉 DeepTech:“我们的实验表明,智能体在仅有第一人称视角与严格带宽限制下,不仅形成了类似网格细胞的空间表征与具备明确语义的离散符号系统,还分化出类似社会位置细胞的功能神经元,显著提升了任务成功率与通信效率。”


这项研究为理解社会位置细胞的产生提供了计算模型,也为多机器人系统在低带宽或通信受限场景中的高效协作提供了新思路。这意味着基于该成果不仅能让机器人变得更加聪明,还能帮助我们理解人类大脑是如何学习和如何社交的,未来甚至能够用于机器人仓库搬运和灾难救援等许多地方。


Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞


图 | 方政儒(来源:方政儒)


在 Agent“大脑”里长出网络地图


大多数人都使用过手机上的地图软件。人类在一定程度上依靠地图认路,而科学家发现老鼠和蝙蝠等动物的大脑中也有一种脑内地图。2014 年,几位科学家因为发现了大脑中的 GPS 细胞,也就是位置细胞和网格细胞,获得了当年的诺贝尔奖。这些细胞等于是大脑里的导航仪:位置细胞可以告诉你现在在哪儿,网格细胞则像坐标纸一样帮助我们测量走了多远。


有趣的是,科学家后来还在蝙蝠大脑里发现了社会位置细胞,这种细胞能够记住同伴的位置,让动物们在觅食或者躲避天敌时能够默契地配合。


Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞


(来源:左图 Edwards (2018),右图 Omer et al. (2018))


那么,Agent 能不能也长出这样的脑细胞?本次研究中,方政儒等人并没有教给 Agent 任何关于地图的知识,只是让它们在迷宫里一边走、一边试着预测自己和同伴接下来会看到什么。结果发现,Agent 的神经网络中真的自发出现了一种类似网格细胞的激活模式,并呈现出整齐的六边形图案,就像蜜蜂巢穴一样。


这种图案和动物大脑中的网格细胞非常相似。更重要的是,如果人为地关掉这些细胞,Agent 就会突然不认路了。这说明,这些自发形成的结构对于 Agent 构建空间记忆至关重要。


Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞


(来源:方政儒、郭彧)


Agent 之间也会互相说悄悄话


但是,假如两个 Agent 一起在迷宫里寻找目标,它们该如何交流呢?你可能会想:它们可以随时互相发送所看到的一切信息。然而问题来了,如果迷宫很大或者信号很差,这时传递太多信息就会非常慢和非常耗电。


研究中,方政儒等人给 Agent 设置了这样一个挑战:让它们只能传递很少的信息,以此观察它们是如何合作的。结果发现这些 Agent 居然自己发明了一套高效的沟通模式:它们并不会不停地说话,而是只在最需要的时候使用很短的暗号进行交流。


比如,当一个 Agent 走进死胡同的时候,它会向其他 Agent 发出此路不通的信号;当 Agent 走到一个关键岔口的时候,它会发出一个“这里有三个方向可选”的信号。


更聪明的是,Agent 会判断同伴最有可能在哪里猜错,因此它可以只在对方最容易迷路或者漏看的地方才发出提示。这样一来,它们即使将某个要传递的信息压缩 32 倍,也能完成同一任务,而且成功率还比多次反复说的旧有方法高出了一大截。


除了地图细胞和秘密语言,本次研究发现 Agent 还长出了第三种有趣的结构:专门负责追踪同伴位置的社会神经元。方政儒等人发现 Agent 的神经网络中会逐渐分化出三种不同的细胞:第一种细胞只关心自己在哪里,就像人脑的位置细胞一样;第二种细胞只关心同伴在哪里,就像人脑的社会位置细胞一样;第三种细胞则同时关注自己和同伴的位置。


而如果人为地抑制那些专门关注同伴的细胞,Agent 预测同伴位置的能力就会大大下降。这说明,这些细胞是在学会预测他人的过程中自然形成的,而不是被事先设计好的。


Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞


(来源:方政儒、郭彧)


这项研究最引人注意的地方在于,Agent 并没有被直接教会怎么认路或者怎么聊天,它们只是被赋予了预测同伴这样一个简单的目标。而在实现这个目标的过程中,地图、语言、社交细胞全部自己冒了出来。这就像我们读书时和同学一起完成小组作业,不知不觉学会了分工、记笔记、甚至发明一些只有我们才懂的暗号一样。


这种机制不仅可以帮助我们理解包含人类在内的动物大脑社交能力是如何涌现出来的,还能直接用在很多机器人合作的场景里。


例如,在仓储物流领域,一群搬运机器人或许可以在大型仓库里自主协作、高效地分拣货物,即使信号不好也能默契配合;而在多机器人搜救场景,比如在地震现场或者火灾现场,机器人队伍可以快速地探索废墟,使用最少的通信量来共享关键信息,更快地找到被困者;在理解社交障碍领域,通过模拟 Agent 社交能力的形成,科学家可以更好地研究自闭症等社交障碍的神经机制,为治疗提供新的思路。


另据悉,方政儒是香港城市大学赛马会“智慧城市”创科实验室的在读博士生(导师方玉光教授),同时也是清华大学深圳国际研究生院智能感知与机器人实验室的访问学生(导师丁文伯教授)。未来,他将继续深耕机器人通信感知与决策领域。


参考资料:


相关论文 https://arxiv.org/abs/2511.04235


运营/排版:何晨龙


文章来自于微信公众号 “DeepTech深科技”,作者: “DeepTech深科技”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md