为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新
7021点击    2025-09-15 16:12

为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


模型能力提升暂缓的情况下,比拼的其实是场景。


GPT-5 的发布,可以看作是一个分水岭。练习时长两年半的 GPT-5,并没有展现出和 GPT-4 本质上的差别,甚至因为模型的预设人格引发了用户的反感情绪。


这基本宣告了一个事实,过去两年,大模型的能力跃进并没有本质突破。各家模型即使在跑分榜上有差距,这种差距也很难传递给用户。单纯的模型参数与能力的「军备竞赛」已非战场的全部。


所以站在这样一个时间点,在模型能力趋于同质化、所有 AI 公司都用「一句话生成 xxx」作为标准宣传语的时候,真正的分野在于如何将技术落地,为用户创造真正的价值。


带着这样的观察视角,我体验了 MiniMax Agent。


01

社区化的创新:Gallery 和 Remix


大多数 Agent 产品都面临一个共同的用户体验障碍——一个输入框,和无限的可能性。


这对于缺乏经验的创作者而言,无疑是一块令人望而生畏的「空白画布」。正如乔布斯所言,用户常常不知道自己想要什么,直到你把成品摆在他们面前。


MiniMax Agent 通过一个类似「应用商店」的 Gallery(作品廊)区域,直面了这个问题。图库中既有「交互式统计学教程」这类教育应用,也有「横版冒险游戏」这样的轻娱乐,还有「全球演唱会指南」等实用信息工具。这种设计,实际上把用户的思考从「我该怎么做?」引导向了「我能做什么?」。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


在输入框下方,是 MiniMax 的 Gallery 区域,其它用户已经完成的作品会在此展示


不止如此,MiniMax 还引入了「Remix」机制。如果你对某个作品感兴趣,你可以花上 100 积分修改这个作品,让它成为你自己的版本。而这 100 积分,也会作为一种激励全部返回给原作者。


这是一个三方共赢的措施:


  • 新用户可以用一个较小的代价获得一个比较确定的产出


  • 老用户可以用作品获得激励


  • 而对于 MiniMax 来说,这不光是促进了创作者生态的繁荣;更为实际的,他们所消耗的算力成本也更少了。


我们从 Gallery 里选了一个「OpenAI 新闻网页」案例。它的原始需求很明确:「用 Serper API 每分钟更新 OpenAI 新闻,UI 贴近 OpenAI 官网的油画质感」。基于这个基础,我们提出了定制需求:「除了 OpenAI,还要看谷歌、Anthropic、微软、Meta 的 AI 新闻,UI 改成苹果官网的简洁风格」。


随后,Agent 就给出了清晰的升级计划:自动任务分解、制定执行步骤,并在获得用户同意后开始执行,还会主动问「是否符合预期」——整个过程不用自己写一行代码,只需要确认需求就行。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


MiniMax Agent 拆解任务


值得注意的是,在开发过程中,Agent 还主动要求了需要的 API 权限(Serper API 用于搜新闻,Supabase 用于存数据),这意味着它具备了处理数据存储和管理的全栈开发能力,而不只是一个「前端皮肤」生成器。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


Minimax Agent 要求后端数据库授权


经过十几分钟的开发周期,一个定制化的新闻聚合器就基本完成了。不过初始版本只有 Anthropic 的新闻成功获取,其他公司的新闻出现了缺失。好在 Agent 很快识别出问题,又花了十几分钟迭代修复。最终成品不仅能按公司筛选新闻(比如只看微软 AI 动态),还能手动搜索关键词、每分钟自动更新。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


https://r8jzmyahyxr7.space.minimax.io/


这个过程的亮点在于,在 Agent 的协助下,如果后续有迭代需求(如添加更多订阅源、更换 UI 风格等),在 Agent 的协助下都能快速完成。同时,所有工程文件都经过规范化整理打包,为有经验的开发者提供了精细化手动修改的空间。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


任务完成后,MiniMax Agent 还给出了规范打包的工程文件|图片来源:极客公园


对于 MiniMax VIP 用户,还提供了个性化域名服务。完成作品之后,用户可以直接发布,交付使用。


也就是说,从开发、测试、部署到发布,MiniMax 提供了一个完整的产品交付闭环,这和早先只是静态网页式 Agent 产品还是有本质区别。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


MiniMax 还提供了个性化域名服务(付费)


02

复杂场景应用:创造一个创意美食 App


为了进一步测试 MiniMax 的能力边界,我设计了一个更具挑战性的任务:开发一个基于 AI 的美食探索 App。但它的核心功能不是推荐餐厅或菜谱,而是通过分析用户的感官描述和喜好,来反向推导出他们可能喜欢的特定美食或饮品。


例如,用户不再输入「上海小笼包」或「日式拉面」,而是输入一系列感官关键词,比如:「有嚼劲的」、「微辣的」、「带有烟熏味的」,AI 会根据这些关键词推荐符合描述的美食,有点类似「猜你喜欢」的食物版本。


这对于 agent 的挑战在于,它需要:


  • 跨模态理解:将抽象的感官描述转化为具体的食物


  • 强大的推理能力:从少量线索中推导出准确结论


  • 深厚的美食知识库:涵盖全球各地的美食文化和特色


面对这个复杂度显著提升的任务,开发时间从之前的十几分钟延长到了半小时。


最终的成品长这个样子,因为我没有提出 UI 方面的特殊要求,成品比较简单,但也达到了及格线。App 具备了应有的基本元素:恰当的应用命名、清晰的用户引导界面,甚至还有富有文学色彩的 slogan。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


最终成品的访问地址:https://47upjztctd5b.space.minimax.io|图片来源:极客公园


在测试中,对于「童年」这类具象关联性强的关键词,App 能返回「香草布丁」、「冰淇淋圣代」等匹配度较高的结果。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


「味觉侦探」界面


当但当面对「在人间」、「我的大学」这类更抽象的关键词时,系统便难以提供有效匹配。这其实暴露了底层数据库的局限性。但就功能实现来说,作为一个半小时内完成的作品,表现已经很不错。如果匹配上更专业的开发者和更丰富的数据库,味觉侦探其实可以很快就成为一个成熟的产品。


03

给自己造一个文保地图


最后,我基于自己的需求,让 MiniMax 给我做了一个文保地图。


市面上已有的产品,如华夏古迹图、文保在身边等,都无法满足我的需求。他们要么是性能拙劣、UI 粗糙,要么收录的文保单位数量有限,且夹杂了许多我不需要的增值服务。


此前我曾尝试过将文保数据导入苹果地图、谷歌地图。苹果的问题在于并不支持数据导入,每一个文保单位都需要手动创建。谷歌地图支持数据导入,但是很难满足一些我的个性化需求,例如将各个层级的文保单位(国保、省保、市保)分层显示。此外,它对数据行数有限制,最大只支持 2000 行,同时且对网络环境也有要求。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


在谷歌地图中,所有目的地都混杂在一起|图片来源:极客公园


在 Minimax 的帮助下,我自己做了一个文保地图。成品最终如下图所示。相比谷歌地图而言,界面更加友好,有更详细的背景介绍。点击导航键之后也可以跳转至高德地图导航。对我来说,这款应用的最大优势是高度可定制化。即使不懂编程,我也可以随时要求 MiniMax 按照我的想法进行后续的迭代和改进。


为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新


用 MiniMax 制作的文保地图产品|图片来源:极客公园


然而,目前这款应用的数据库仅仅收录了 12 个文保单位的信息。主要原因是,要获取包含经纬度的专业地理数据,通常需要特定的账号权限才能登录某些专业数据库,这超出了当前 AI Agent 的能力范围。


这让我意识到一个现实:以 MVP(最小化可行产品)的标准而言,这个文保地图是合格的。但是「一句话生成 App」还只是一个宣传口号,实际上在创建一个真正可用 App 的过程中还需要大量的人工介入,无论是前期的产品文档撰写还是之后数据库支持、运营维护等等。


总结一下 MiniMax Agent 的优点。


Gallery 和 Remix 功能算是还不错的功能点,它可以引导新用户创作、促进老用户的创作动力,并且在更低的算力成本下加大了社区的活跃度。


全栈开发能力是一个贴近实际生产环境的功能。MiniMax 集成了后端数据库、一键测试、部署等完整的开发链路,产出的产品具备真正的可用性和交互性。


至于缺点,坦率地说,MiniMax 本身并没有明显的产品缺陷,它所表现出的问题主要来自两个层面:


AI 技术的内在约束:包括模型幻觉现象、对真实世界理解的局限性等,这些是当前 AI 技术发展阶段的共性问题。


人类认知的投射:AI 技术的华丽前景往往折射出人类复杂的情感诉求,而这种期待本身就承载着人类认知的局限性。


对于现在的 AI 产品,我观察到身边的朋友有一种矛盾的复杂情感。


一方面是厌烦。AI 产品层出不穷,"逆天"、"炸裂"等夸大词汇充斥着信息流,让人产生审美疲劳。


另一方面又是恐惧——万一呢?万一真有他们说的那么好?那我的工作是不是会被淘汰?


虽然 Agent 在特定任务上展现了强大的能力,但在实际生产环境中,它还远未达到可以完全自主运行的水平。


将 agent 想象成一台 3D 打印机会更恰当


就像 3D 打印机能够将数字模型转化为物理物体,满足小规模、定制化的生产需求,现在的 agent 也擅长处理特定、界限清晰的任务。它们可以根据明确的指令生成代码片段、撰写特定主题的文章或自动化重复性强的流程。这些应用场景通常是针对个人用户或小规模团队,用于实现个性化、快速迭代的目标。


然而,3D 打印机无法替代大规模的工业化生产线。同样,现在的 agent 也无法直接进入复杂的生产环境。大规模生产需要的是高度可预测、可靠且经过严格质量控制的系统,而当前的 agent 缺乏这种稳定性。它们可能会产生「幻觉」,出现无法预料的错误,或者在面对复杂、多变的实际场景时表现出脆弱性。


客观地说,AI 的能力其实处在一个中间态。确实展现了前所未有的强大能力,却又存在着明显的缺陷。与其说它有多么地强大,更准确的描述是,它承诺了一个充满可能性的未来


实际上,只要再深入了解一下,就可以轻易发现 AI 的脆弱。正如杨立昆所说,现在大语言模型本质上是一种「统计机器」,它通过在海量的文本数据中学习词语之间的统计关联性,来预测下一个最有可能出现的词。


换句话说,AI 并不理解世界,本质上是猜测,是一种对人类的模拟。一个模型可以学会「火很热」和「水能灭火」的词语关联,但它不知道为什么火是热的,也不知道水如何从物理层面扑灭火焰,它只是在复述训练数据中已有的模式。


就像你教小狗做出「恭喜发财」的动作一样。小狗当然不懂什么是恭喜发财,但是这么做之后,就会有零食奖励。


AI 也是如此。


文章来自于微信公众号“极客公园”,作者是“汤一涛”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT