没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实
6283点击    2025-11-27 14:37

两位长期站在具身智能第一线的亲历者,给出了罕见清晰的判断。


UCSD终身教授、Hillbot联合创始人苏昊直截了当,表示“没有具身智能就没有通用物理智能、通用智能”。


清华大学助理教授、千寻智能的联合创始人高阳则补上一句现实的验证路径:“只要去scale数据就能解决,本质没有任何区别。”


绿洲资本举办的AGM(Annual General Meeting)现场,就具身智能这个话题——它正从一个技术分支,转变为理解通用智能的关键入口,苏昊和高阳分享了自己的洞察。


除了教职和创业者身份外,苏昊还是最早提出“Embodied AI”概念的学者之一;高阳曾在UC伯克利深耕机器视觉研究,拥有具身大模型训练与机器人真实场景实验上的丰富一线经验。


面对具身智能具身智能研究及产业化落地,就技术演化、模型路线等议题,两人有共识,也有不同的观点。


对谈重点围绕几个核心问题展开:


  • 具身是否是通往AGI的必经之路?


  • 技术突破的真正瓶颈在哪里?


  • 中国在这条路径上的结构性优势是什么?


  • 下一次可感知的跃迁会在何时到来?


没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实


中国具身智能两位先锋的转折与抉择


绿洲:想先请两位老师分享一下,你们是怎么开始创业的。


高阳:我想先分享当时在伯克利的一些所思所想。


我博士最开始做计算机视觉,两年之后,开始做机器人的学习。大概2016年,我们在伯克利的这拨人,大家只是冥冥之中认为说,机器人这件事情对于智能来讲是一个最终的、闪耀的明珠,但是我们其实不知道怎么做,只是都觉得它是解决智能非常重要的最后一英里。


当时OpenAI也已经成立了,也有一些老师,比如说包括Pieter Abbeel在里面做兼职。OpenAI当时就开始天天讲“大算力出奇迹”,伯克利的其他老师认为他在讲一些不靠谱的东西。这个过程持续了大概三年左右,直到GPT-3.5出来,我觉得有一部分人的思维开始改变了,觉得看到了不一样的东西。


那时候其实已经到了2021年左右,我已经回国了。


最开始我还没觉得什么,因为大家对“数据越大,模型说话越来越像人类”的事情没觉得稀奇,直到OpenAI做了post-training,做了RLHF,在那个时间点,我觉得伯克利很多非常资深的教授,包括我自己,对于AI的研究该怎么做,信仰都崩塌了,因为发现OpenAI说的竟然是对的。这可能是我思想层面上转变最大的一个瞬间,发现这个东西真的work,它竟然能够通过这么简单的方法,只要去scale数据就能解决。


为什么我现在在做具身的创业?其实也就在那一个时刻我意识到,对于具身智能也是一样,本质没有什么不同。只是说我们在解决的不仅仅是说话,而是包括做动作、对于视觉、语言、触觉、听觉等等各种各样输入的模态,进行系统化反应的问题,本质没有任何区别。


从第一性原理去推导,无论时间长短,在几年时间之内,具身智能也会因为完全一样的技术变化趋势和外推,产生巨大的飞跃。


所以在那个时间点,我就知道了具身智能要来了,然后我想去做这个事情。


绿洲:感谢高阳老师的分享,那苏昊老师呢?


苏昊:我进入人工智能领域的时间还要再早一点,大概是2002年,还远在深度学习的年代之前。


那时候我在北航的导师是一位数理逻辑学家,当时大家都在研究如何做自动的定理证明。后来就发现这个规则的边界是有限的,对于常识的表达非常难。差不多那个时候,我开始更加地相信统计学习的方法。但那个时候统计学习最主要的应用场景还是自然语言处理。


2005年那时候研究用生成式模型去写对联,当时有一天我就觉得有些事情不对劲,因为我的程序也可以把对联写好,但它好像没有一种真正的心智。


比如说当他说到“蓝田日暖玉生烟”,当你说到“日”的时候,你是有很多意象,你会感受到某种温暖,有很多想象。这一部分是感官和文字的连接。我发现在符号的世界里,缺乏这种连接。于是这就让我进一步思考一个视角,就是智能应该是对物理世界交互过程中产生的一种抽象,这个视角就导致我的兴趣转向了计算机视觉。计算机视觉就是更底层一点、有关物理世界的理解了。


时代发展得实在是很快,到了2008年,当时也很有幸作为学生的Leader,参与了ImageNet这个项目。结果就发现计算机视觉,原本认为是一个非常复杂的问题,现在看起来也可能可解。


计算机视觉也是我博士最主要的经历,这一点跟高阳是类似的,所以我们其实很多年前就认识。那个时候我们在计算机视觉领域取得一定进展之后,就自然而然地去想,有没有可能再回到我们AGI的问题上去,就是计算机视觉在AGI整个框架里应该往哪儿放?那么我们离实现AGI还有多远?


视觉实际上就是机器人的眼睛,实现了物理信号到一种符号,或者说一种内在的、可以用来理解和推理表达的转换,必须要进一步地推动对空间的理解,这就构成了我后来的一部分工作,就是空间智能的研究。


在空间智能的研究又进一步取得了所谓突破之后,我们就开始认真地去想,通用智能该咋做了。这个时间点应该是在2017年左右。所以我当时内心最大的一个疑惑就是,通用智能到底该怎么定义。我当时觉得可能还是要回到跟人的类比中去想,人是对世界是有非常多认知能力的。如果具备了所有的认知能力,我们就可以认为得到了跟人类似的一种智能体。


在当时,我想计算机视觉的能力是帮我们把信号映射为符号。可如果机器要有一个自我意识,要有进一步的认知能力,那他最缺什么呢?


我想了很久,最后得到的落脚点叫做“缺乏一种概念的涌现能力”,也就是人让他认知什么,他就可以认知什么。他自己不知道他自己是谁,他也不知道该认知什么,所以问题就在于概念涌现怎么解决。我觉得从如何解决概念涌现这个角度出发,这套思考就把我引向了定义“具身智能”这个问题上。


作为人类我们会去讲知行合一,我们会去讲认识世界、改造世界是统一的。如果你要没有“行”,也没办法验证“知”。如果你没有改变世界的这个目标,你就没有认识世界的这样一个驱动力。但是要改变世界,没有形态、没有身体那是不可能的。


所以我们必须得考虑在具备一个形态、身体加持的前提下来实现通用智能。从这个角度来说,我会认为没有具身智能就没有通用物理智能、通用智能。所以说这个具身智能是通用智能的一个出口,就构成了这样一个理解。我看到学界不只是我,也有其他的老师有一定的这种共识,所以我们就开始推动具身智能。这种理解也就导致了我们对技能栈、技术栈的一种选择。


差不多2022年左右,通过ChatGPT、Transformer的成功,我们看到了一些有趣的事情,这其中的一点就是,如果围绕着概念涌现这个问题,那么Transformer里面所谓的Attention机制,能够帮我们实现一定的概念空间的组合编排,这构成了非常大认知能力上的突破。同时强化学习和世界模型,在我们研究过程中也有了很大的进展,高阳老师当年也有工作,对我有所启发。


几件事让我感觉具身智能作为一个学科,它相对清晰了,底层所需要的逻辑、突破所需要的核心技术点都在那儿了。我们也进一步认识到,要想把这样一套通用的物理智能、具身智能框架完全实现,需要很大的力量加持,如果没有一个资本的支撑,在学校里是无论如何都达不到的。


我觉得从宏观、从对整个技术的理解来看,都觉得应该做这个事儿,于是就做了。


通向AGI,必须要有“身体”


绿洲:感谢两位老师。因为现在有很多讨论,是从纯AI的角度走向AGI,也有一派说一定要有身体,才能真正地走到AGI。那在两位老师看来,身体它是必须有的吗?还是说直接可以从AI、多模态来通往AGI?


苏昊:我整个思维的起点就是,必须有。


我觉得刚才张津剑(绿洲资本创始合伙人)讲得特别地好,对我也非常地有启发,我们将迎来一个agentic的时代。在这个时代,如果它是一个虚拟智能体,我想它总体来说还是在商业社会、在工业工作流的效率提升的场景里的一种加速效果,一种资源再分配的效果。


但如果进一步地再问两个问题,比如说刚才讲的科学发现,那真的需要把观察和实验统一起来,那么我们是需要身体去物理上做操作、做实验。如果我们今天要拓展人类的生存空间,到沙漠里,到深海里,这个时候需要建立新的认知,要不要做到知行合一、做到在新的环境下感知和交互的配合?我们人类要不要走出地球?我觉得肯定要的,而且这件事情也花不了太久。


因为按照刚才的逻辑,科学发展那么快,生产力的释放那么快,我们不能整天在地球上零和博弈。我们有很多的准备,准备好了都要离开地球,让肉身上去登陆火星,还是改造月亮?


如果从这个角度来看,我会认为一个更大的AI视角、通用的智能,甚至是超人类的智能,它一定要通过具身走过去。


高阳:我非常认同。


如果真的要走向AGI,我们一定要有一个身体。我觉得刚才苏老师从非常哲学的层面上讲了很多,我可以讲一些比较具象的例子来说明。


比如说我们要出门,走到门口掰一下门把手,然后想推出去,这个对人来讲太简单了,都是下意识去完成的。但是当你训练机器人去做这样事情的时候,会发现它有无数种方法失败,这种失败是很难想象的。


比如说没有掰到底,它就开始往后推;或者掰到了底但继续往下,把门把手都掰断了,还是没有往后推等等。为什么呢?因为它现在在比较简单的训练范式之下,没有真的与环境交互的经验,所以他没有办法学习到“我手要掰到这儿才能把门推开”。


其实这个事情不仅对于机器人,对于当前的大语言模型,包括视觉语言模型也是同样的道理。这也是为什么大家最近在大语言模型进入到了post-training、RLHF的时代,因为我们要让Agent能够和现实之间有一些交互。通过这些交互,Agent就知道什么东西做对了,什么东西做错了,才能从经验的交互里去学习到底什么是对的,什么是错的。


刚才我讲了一个具身世界的例子,比如说Agent的例子,我让他去订机票,让他去给我写代码。其实现在大家都在做,无论是在Docker或者虚拟机环境里去做强化学习,来强化这个技能。


对于即使非具身这些应用,比如说视觉语言模型、VLM模型,大家也发现了,因为当前我们训练主要的范式,是非强化学习的范式,是看互联网上图文数据这样被动学习的范式,即使是最先进的模型,比如说GPT-4,包括Gemini 2.5 Pro,很多时候你问他“这个图片里面一个物体在另一个物体的左边还是右边”,它都经常会说错。这些知识在人类的语言里是没有经常被提到的,人类不需要说这些东西,他看图片就知道东西是在我的左边还是右边。那么就没有一个语言层面上的监督,去让视觉语言模型学会这个知识点。


所有这些例子其实都指向说,我们未来如果要让无论是虚拟的agent还是真实的机器人具备通用的能力,和现实世界或者和环境交互,是特别重要的一环。


我的结论是,如果我们真的要获得AGI,真的想让机器人去处理我们物理世界问题的话,与真实环境的交互和经验是必不可少的一环,也的的确确需要具身智能来达到这个目标。


中国具身的优势在哪里?


绿洲:另一个问题是,既然“拥有身体”这么重要,是未来通向AGI的必经之路,那现在中美两国在技术上有差距吗?以及你们觉得中国有什么优势,在哪些维度能有胜出的机会?


高阳:本质上中美两国是最领先的玩家,在技术上没有什么特别大的区别。


我最近也去美国很多次,比较客观地去看待这个事情的话,美国的优势在于说,虽然这些最顶尖的公司是接近的,但美国的人才数量,说实话还是比中国在绝对数量上多一些的。这也是源于美国具身智能、科研体系发展的更久一些,所以培养了很多这样的人才。中国具身智能主要的中坚力量,可能也是在美国培养出来的。


当然我们在最顶层的宏观设计层面上,和美国认知是基本一致的。


这是我觉得在美国的优势之一。优势之二是美国的资本是比较愿意去做“世界第一”这种量级的投入。当然这也是资本环境有一些不同,我觉得中国在这个层面上,非常大的优势在于硬件和软件的结合。


比如我很久没去美国了,再次跟英伟达实验室、斯坦福实验室去聊的时候,他们每天脑子里在想的事情是说,“我机器人坏了,要修三个月可怎么办?一定不能要让这个机器人坏。”但是我们维修机器人的周期,大概最多一到两周。


如果大家做机器人的话,就知道修机器人是件非常痛苦的事情,并且一个项目能不能成功,是取决于你的迭代周期的,在美国迭代周期其实是被硬件损坏和维修时间所支配了,国内我们可以快3-10倍之间的平均速度。


在美国大家买这个硬件配件基本都从淘宝海运,然后需要可能一周的时间才能运过去,并且是最快一周。


但中国可能你非常着急,明天你就能拿到你的这个配件。这个优势其实不仅仅延伸到使用成熟的机器人平台,也包括有一些新的硬件上的想法,在现实中去迭代和试错。


并且我觉得在具身智能这个时代,硬件和软件的co-design是极其重要的事情。机器人的设计其实就像你去创造亚当和夏娃一样,最开始创造他们的时候,拍脑袋觉得它是一个好的设计。


但实际当你真的把他们用到真实操作的任务上之后,你会发现有巨多的局限性。你需要反复去更改你的硬件设计,包括数据的采集等等,都需要很多硬件联合的设计。这是第一点。


第二点,我觉得具身智能它和大语言模型不太一样。大语言模型我们经常去讲scaling,那么瓶颈是什么?瓶颈现在是电力。


我去美国之后,大家都在想说我们的电厂需要2年到3年之后,才能跟得上大语言模型训练进步,所需要消耗的电力的速度。但是对于具身智能,它是不同的瓶颈路段。我们看一个行业,需要看这个行业的最短的那个板是什么。对于具身智能当前的最短板,其实是数据这个层面。我自己是比较坚定的real-world data believer,苏老师可能和我不太一样,在仿真器这方面的探索会更多一些。


所以对于现实世界数据这个方面,我觉得中国是有巨大的优势。一方面是因为人力成本,另一方面是因为我们的组织能力和对于数据的迭代的效率,都会比美国快很多。


客观面来讲,其实两方面都有各自的优势和劣势。作为我们公司,我们尝试把所有的优势面发挥得更广一些,同时也会尝试补齐劣势。


苏昊:高老师评价的已经相当完整了,所以我只做一些补充性的评价。


中国全社会对于具身智能这件事的投入度,我认为是要比美国好的。因为美国不管市场还是企业,资本都是有惯性的,它的惯性就是在于怎么在虚拟的世界里成功。很多时候一旦到了实体方向,都没有信心在竞争中赢过中国。


第二点就是供应链问题。刚才高老师说了很多有关中国供应链的优势,我再补一个问题,就是美国现在的关税政策的不确定性,对于初创企业的影响可能是比较大的。比如说能不能用中国的供应链,然后用了之后到底是用多少税,要不要做一个备份性的布局?在一个非常早期技术迭代的周期里,要整天头疼这个问题是很不合适的。


另外一定程度上,中国在具身智能这件事情上是不太有退路的。现在这种格局之下,如果在虚拟AI上去赢美国应该是有难度,不一定不可以,但肯定是有难度。那么具身这件事情就变得必须要持续地支持下去。可能从政府到企业、民间,总体来说这件事情上没有那么多的退路,必须冲上去。这是我的一个感觉,但判断不一定是正确的。


最后说一点就是芯片这件事对中国的确是一个问题,包括端上的芯片,也包括这个训练的芯片。尤其是端上芯片这件事,希望美国政府能相对合理地去处理。不然就要寄希望于中国有自己足够强大的芯片供应链体系了。


具身泡沫确实不小,但是进展也很真实


绿洲:苏昊老师也提到了,中国现在对于具身智能必赢的决心。在这种情况下,也会有很多人说现在政府或者各个方面参与很多,行业的泡沫很多。


但我相信你们作为一线的创业者,肯定看到了很多我们没有看到的东西。那你选择在这个方向这么去投入,能不能分享一下你看到了什么?以及站在外面来看,我们应该去期待的下一个milestone或者突破会是什么?


苏昊:我现在这个阶段是很有意思的,泡沫的确是不小,但是进展又是真实的。


比较正常的产业化顺序应该是,科学框架清晰,技术有突破,开始产业化,对吧?产业化开始探索商业模式、规模化等等。


那么具身,不只是具身,整个AI,现在属于全民做研究的状态,从一级市场到二级市场,大家都要把钱拿出来。


为什么?因为本质上这个问题太大,然后越大的问题,我们觉得有可能成立,大家就只好越早地进入。可能你真的等到它非常清晰能成、能进入的时候,已经轮不着你进入了。


所以先说一个我的基本观点,这个事儿本质上现在是“全民做科研”。但因为确实是节奏太快,从科研到转化之间的时间段延时是不大的。这就是一方面你能看到泡沫,另一方面你还是要看到,在整个AI的研究界,具身智能是下一个突破点,是通用智能的出口。


比如计算机视觉等等方向的人,问他看见了什么?


看见的就是学界的一个高度共识,大家在测试、在试图去看到一些Scaling Law。包括各种各样的数据模态,仿真、真机采集、视频,那背后数据模态一般是跟算法相伴的,这个VLA、强化学习、世界模型等等,你都能看得到很实在的进展。所以我觉得整体上应该是这样去把握这个事儿。


“世界模型”这个词一定程度上被滥用了


绿洲:那接下来的问题是,你觉得世界模型是解法吗?最近包括Yann LeCun也要出来做世界模型了,这个方向非常的火。


苏昊:其实世界模型作为一个名词,一定程度上被滥用了。或者说每个人所说的世界模型是不完全一样的。


不过有一点是共同的,就是我们需要对物理世界的常识有了解。就是我刚才讲的,有关把物理信号转化为一种机器人能用的表征这件事情,所有人都觉得它很重要。那么通过一些视频预测或仿真等手段,都可以去试着建立这样一种表征。


我认为不是说它是不是个解法的问题,它是在一个相对正统的框架里的一个重要组成部分。所有试图不做这件事,就解决问题的努力,都是不合理的。


简单说一下VLA这件事儿。VLA到底说了什么?他说视觉进、语言进、动作出,这件事没有错。但另一方面,具体架构是什么?一个不在世界模型的支撑之下的VLA,这件事情我又认为是不可能对的。


绿洲:那您觉得距离下一个突破还需要多久呢?


苏昊:主要取决于定义什么是突破。


所谓通用智能,它是一个相对连续的进展过程。当年Sam Altman说GPT-3,Scaling Law在长期看来能实现AGI。其实我当时听来,不只是我,估计所有投资机构的人听起来,都会觉得这只是一个话术。


但是你说它是不是个突破呢?它绝对是个突破。AGI不是一个突破能实现的,它是一轮突破、若干个突破才能实现的。


其实下一个突破口要定义这是谁眼里的突破?如果是研究人眼里的突破,可以维持投资人兴趣的、信心的突破,那我觉得会在这一两年的尺度里出现。如果一个广大公众能够看得懂的突破,那还要再慢一点。


机器人具身模型的GPT-3.5时刻还需要2-3年


绿洲:高阳老师,因为你主要是在研究VLA这条路径,我记得23年底,你跟我讲这条路径的时候,我应该没有听其他人说过。到现在也是一个非常通用的名词,也有一定共识了。你怎么看这条路径上的进展,包括你在期待的下一个milestone是什么?


高阳:2023年的那个时间点,其实我只是意识上觉得,这个东西在逻辑上、从原理上没有什么问题。但是我很难去预测说这个曲率到底是1.0、2.0还是3.0。但比如从现在模型的能力上来讲,它的这个进化的速度是比我想象中还要更快的。


刚也聊到了是不是泡沫的问题,我们的真实进展到底有多少,以及下一个突破到底是什么,我觉得其实最好锚定的点,还是说回到大语言模型的话语体系。因为大语言模型在这个领域,其实相当于把我们的数据问题完全解完了。


具身模型其实是,至少初级阶段是一个copy的过程,我们只是在copy大语言模型初级阶段所取得的那些成功经验,到具身模型里面。在这个过程中,现在解决的问题是一个预训练的问题,让模型具备很多先验的知识。所以大家可能看到的下一个突破是,模型在今天这个时间点,已经可以sort of明白你的指令,有些看起来有点合理的执行,但还没有那么精确。


当然正如苏老师所讲,这个东西是连续的过程,它可能不是非常跳变的过程。那么在这个连续的过程中,我觉得下一个时间点能看到的,这个模型听话的程度会越来越高。它能更好地去完成更多种多样的物理行为,直到某一天突然发现你可以把所有的行为串起来,可以完成一个很复杂的任务,那我觉得这是机器人具身模型的GPT-4的时间点。


我预测,4的时间点可能不是很好讲,但我觉得3.5的时间点,大概还有2到3年。


“give me money, leave me alone”


绿洲:最后一个问题,觉得绿洲带给你们什么不一样的感受?


高阳:绿洲是我们第一轮的两个投资人之一,其实我们公司历史并不长,可能就一年半多一点。在我们公司所有历史当中,我觉得绿洲真是mentor我对于创业这件事情上的一些思考和成长。因为平时津剑、Ivy和我交流的蛮多的,他们经常会问我一些平时不会想到的high-level的一些问题。我觉得这些问题每一次去想的答案都不一样,但每一次的答案都比之前更加清晰了那么一点,我非常appreciate这些讨论。


另外一点,包括今天这个场合,也是我在创业之中非常珍惜的一个场合。因为我可以去认识更多的创始人,去听他们的故事,去听他们的经验和教训。我觉得这其实是在非常漫长、并且你的奖励信号非常稀少的创业过程之中,极其难得的经历。


刚才我本来还想说硅谷的另一个优势,就是创业氛围的密度很高。为什么这么讲?因为我之前去Palo Alto找一个餐厅吃饭,首先我走错了,但是我走错餐厅之后,就发现了Scale AI的创始人在里面吃饭,然后又看到好多熟人。并且在这个氛围里面,就有很多Conversation that is happening and is really in spiring。


我觉得在中国的条件下,密度没有这么高。但绿洲给了我很多机会,有这样的对话可以去Start to happen。所以我觉得这两个方面上,都是我感受非常好、并且成长非常多的部分。希望未来有更多这样的活动。


苏昊:我在做教授的那个阶段,总体对所谓出资人的期望就是”give me money, leave me alone”。但我的感觉就是创业,尤其是津剑、Ivy确实是给了我一种可以跟投资人做朋友的感觉,对我来说去建立这样的信任是不大容易的。


因为我确实原本的心态就是”give me money”,但现在我有一些问题的时候,我会真的去问他们,真的去寻求帮助。而且我也感受到了我的问题有些也没有那么容易回答,他需要去帮我翻阅一些资料,或者包括找人,都要花好多时间,是真的有帮助、有结论的,甚至是持续的“问一答十”。


可以说,这是绿洲很深地改变了我作为企业创始人和投资人之间关系的看法,我觉得能做到这一点是非常了不起的。


文章来自于“量子位”,作者 “允中”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md