领养了阿里猴子,两天后,我发现它比“牛马”厉害

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
领养了阿里猴子,两天后,我发现它比“牛马”厉害
5177点击    2026-03-24 10:02

领养了阿里猴子,两天后,我发现它比“牛马”厉害


对话即执行,这次离现实更近了。


智东西3月23日报道,3月17日,阿里推出全球首个AI原生企业级Agent平台——悟空,引起产业人士的广泛关注。


这不仅是阿里成立CEO吴泳铭亲自挂帅的ATH事业群后的首秀,也是其继千问之后打造的又一AI Agent重要入口,或将影响全国2000万钉钉企业客户及近8亿用户,实际体验如何?


智东西第一时间获得了悟空内测码并对此进行了体验。进入悟空,我们能看到这是一个类似于OpenClaw对话框的界面,算力消耗按“算粒”来计算,每日更新100个免费算粒,大概可以执行4-8个中等复杂任务


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空体验界面


实测下来,悟空在三方面的表现可圈可点,但也有明显边界:


在基础认知与任务拆解方面,给它“新开咖啡馆要引流”,两分钟后,它既给出了完整的活动方案,也搭好了可直接预约的落地页。模糊指令到可准确执行输出,衔接流畅。


在企业级系统与工具调用方面,让它去1688筛选符合条件的三家货源,它能自主登录、检索、纠错,最后生成一张包含商品信息、店铺评分、沟通记录的钉钉表格。复杂多步骤任务完成度不错。但涉及通讯录权限时其也显出局限,让它定时给好友发消息,它启动了任务,消息却发给了我自己。


在创意内容生成与精准控制方面,让它做24节气视频,诗句和节气能一一对应,飘落花瓣粒子效果也能呈现;让它用“动画大师”做GDP排行榜,数据准确,还能根据“左边有点空”的反馈迭代修改。但在动态插画、地图轮廓这类细节上,生成精度还有差距。


总体来看,悟空在处理开放性任务、打通多平台操作上已经展现出实用价值,但权限边界细节控制在当前版本仍有进步空间。


01.

基础认知、任务拆解和执行:

脑子好用手速快


按惯例,我们首先看看悟空的基础认知与任务拆解能力如何,这是完成更复杂任务的基础。


提示词:悟空,我是一家未来科技城新开的咖啡馆,下周开业,帮我策划一个线上引流活动,目标是让附近3公里的白领都知道我们。


这一题是为了测试悟空是否能准确理解模糊指令,并将其拆解为可执行的、逻辑连贯的子任务。


可以看到,当悟空接到任务,一边为我创建一个活动营销页面,用于推广开业活动,给出了应用创建过程链接;一边为我完善整个线上引流活动的策划方案,直接在对话框里呈现内容。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空将需求拆解为两个任务进行执行


大概2分钟之后,线上引流活动的策划方案首先输出,给出了开业首周优惠、 社交裂变传播、会员锁定策略等核心活动设计,以及精准地域投放、写字楼渗透、社群运营等推广渠道策略。整体消耗4.6个算粒。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的线上引流活动的策划方案


下图是悟空随后给出的营销落地页面,包括客户端和手机端两个版本,预约入口点进去可操作,页面风格与咖啡店调性契合,落地页内容覆盖了前面提及的各种营销措施和基本的时间地点信息,几乎不需要修改,就能直接应用。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的营销落地页面


可以看到,尽管我的需求比较模糊,悟空能够理解“线上引流”的内涵和玩法,给出了比较具体的方案,还给出了明确可执行的活动时间节点,以及比较符合咖啡店行情的预算建议和效果预期。


接下来,我通过一个域名查询的题目,来考察悟空的信息检索与执行。


提示词:悟空,帮我查一下example.com域名是否被占用,如果可用,多少钱能买?


仅仅花了30秒,消耗0.7个算粒,悟空就自动查询了域名注册信息,反馈这个域名是已经被占用的状态,展示出比较敏捷的信息检索能力。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空回复内容截图


02.

企业级系统与工具调用升级:

复杂的活也能干,一些权限管得严


接下来,我们将体验升级,把悟空放到更复杂的企业工作环境中进行测试。


提示词:悟空,1688上找一下“露营折叠椅”的高性价比货源,要求供应商必须有牛头标(诚信通),且最近一周评价量大于100。筛选出3家,把沟通记录和样品申请状态同步更新到一个铺货表格里。


这一题是为了测试悟空打通企业权限、操作第三方软件、读写数据的能力,这是企业级Agent的核心。悟空大概耗时5分钟,消耗了34.7算粒,最终给出了一份准确的表格统计。


在输入提示词的同时,我勾选了“1688选品”这个Skill,紧接着悟空就开始执行我的命令。它首先打开了1688官网,首次访问需要我手动登录账号。在我登录之后,悟空就开始自动检索搜集。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空自动在1688进行检索


在这个过程中,悟空出现了2次搜索出0个结果的情况,但它立刻找到了是“类别选错”等问题,于是自行进行了纠正并搜索出正确结果。


紧接着悟空就开始进行统计信息,不同于人类用户需要依次点开页面的动作,悟空的1688界面停在了搜索结果总览,聊天界面上直接输出了我需要的统计结果,大概2-3分钟后,其给出了一个可点击的表格链接。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空输出的答案


点开链接可见钉钉文档的界面,这是悟空内置的表格功能支持,可见三家店铺对应商品ID、商品标题、商品链接、主图URL、价格、近期成交件数、店铺名称、店铺链接、诚信通年限、回头率、综合评分、服务标签、沟通记录和样品申请状态等维度都详细出现在表格中。


领养了阿里猴子,两天后,我发现它比“牛马”厉害


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的表格页面截图


点击某家的商品链接,可见与商品对应准确,悟空交付了最终的正确结果。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲点开链接可以看到正确的商品页


悟空的一大特征是,其也内置在钉钉App中,用户可以在手机钉钉App通过与悟空对话,完成与客户端一样的操控。于是我尝试用手机钉钉发送了一个小任务。


提示词:每到整点给小白发消息,提醒他喝水,站起来走走。


悟空在接到任务后,没有发现专门用于定时发送消息的技能,但它使用use_cron 来创建定时任务,结合钉钉工作空间技能来发送消息,并告诉我任务已启用。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲用手机钉钉App对话可以操控悟空


但当我以为设置成功的时候,我的朋友小白并没有在整点收到消息,而是我和悟空的对话框中,我自己收到了这条消息。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空的任务执行页面截图


智东西猜想,背后是钉钉并没有给悟空单独给通讯录好友发消息的权限,这也可以理解,如果这个口子放开,可能我们的对话框里会充斥各种AI定时发送的广告轰炸,也可能我们的悟空会被别人通过对话操控,对钉钉用户的体验带来损伤。


不过,悟空在这一任务中的问题是,应该明确说明问题,而不是启动一个不太准确呈现提示词需求的类似任务。


提示词:帮我发邮件给xxx,邀请他来参加我们4月21-22日举办的2026中国生成式AI大会(北京站),在北京富力万丽酒店举行。


可以看到,悟空不到一分钟就为我准备好了邮件草稿,但由于我的钉钉邮箱无法直接发送到这个外部邮箱,它仅为我创建了一封HTML格式邀请邮件,没有替我操作邮件。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的邮件内容参考


总的来说,阿里悟空目前在通讯录等方面仍设置了权限边界,一方面限制了悟空的管理权限,让悟空看起来不如龙虾那么全能,另一方面其也带来了更多安全感,避免造成企业级的信息泄露、业务中断等问题。


03.

创意内容生成与精准控制:

文化理解和数据提取准确

动态效果仍待提升


最后,我比较关注多模态与创作能力的结合,体验了悟空的创意执行与确定性输出能力。


提示词:帮我做一个动画视频,以24节气为主题,每个节气搭配一句古诗和动态插画,运用“水墨溶解转场”与“飘落花瓣粒子”效果。


这个题目围绕“节气诗会”主题,主要考验悟空能否理解中国24节气文化,以及对特定动态效果的生成情况。


大概花了10分钟,悟空生成了以下1分36秒的视频,可见其完整准确地依次按顺序生成了二十四节气,并且配上了与该节气契合的诗句;在动效上,飘落花瓣粒子呈现比较准确和水墨溶解转场基本呈现,动态插画则没有加入。整体画风比较简洁。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的视频部分截图


于是我进一步加大难度,想要考察悟空的数据检索,以及精确控制动画每一帧,区别于普通AI视频的随意性的能力。


提示词:悟空,通过动画大师帮我做一个中国城市GDP排行榜动画视频,榜单展示前十名,用Lightmo风格。


如下图所示,悟空自动调用了“动画大师”这一Skill,为我制作了一个关于中国2025年GDP十大城市的动效视频,符合 Lightmo风格(轻盈现代风格)。


从数据上来看,悟空思考过程显示,其一开始找到了官方的纯GPD总量排名以及华顿经济研究院综合排行榜,最后选用了更符合需求的第一个版本数据。可以看到,视频载入数据与官方实际公布数据吻合,没有出现错误。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的视频部分截图


从动画效果来看,虽然呈现了需求,但我认为视频左边画面比较空,于是再次输入提示词要求悟空进一步修改完善视频。


提示词:视频的左边有点空,可以以中国地图为背景,地图上依次出现前十名城市所在位置的标记点。


可以看到,视频变化不大,悟空确实生成了一些相对位置的标记点,但是中国地图的轮廓却看不出来。整体花费了近15分钟,近60个算粒。


领养了阿里猴子,两天后,我发现它比“牛马”厉害

▲悟空生成的视频部分截图


最后,我还让悟空帮我做了电商主图优化,主要考察悟空分析主图问题、自动调整设计能力。


提示词:悟空,这个商品主图点击率低,帮我优化一下,目标人群是4岁女童。


如下图所示,上图是优化前的图片,右图是优化后的图片,下图相比左图在背景颜色、图案上进行了调整,变得更具备可爱风的特点。


领养了阿里猴子,两天后,我发现它比“牛马”厉害


领养了阿里猴子,两天后,我发现它比“牛马”厉害


时间有限,智东西本次只是针对对一小部分场景对悟空进行了体验。在悟空“技能中心”,我们还能看到近百种推荐Skill可供直接添加使用,从开源平台获取的Skill也可以在悟空中进行应用。悟空更全面的实测效果如何,还有待更深入的体验。


04.

结语:AI Agent时代

企业软件交互方式正被重构


作为阿里布局AI Agent的重要落子,悟空展现了企业级智能体从“对话”走向“执行”的跨越。其在任务拆解、跨系统操作与多模态生成上表现出的连贯性,已初步验证了“AI即服务”的产品范式。尤其在钉钉生态内,悟空具备成为千万级企业智能入口的潜力,但其权限边界与执行透明度仍需进一步厘清。


从产业视角看,悟空的亮相标志着AI Agent正式进入“可交付、可控制、可迭代”的新阶段。未来,随着token经济、技能市场与权限体系的完善,企业软件的交互方式将被重构。谁能在开放能力与安全边界之间找到最优解,谁就能在这场AI代理革命中占据先机。


文章来自于“智东西”,作者 “李水青”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0