OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!
6404点击    2026-05-02 11:18

导读


OpenClaw 刚刚发布 2026.4.27 版本,一次性把 DeepInfra 多模态 provider、非图片附件链路、企业级代理路由、模型选择确定性、网关/通道/会话稳定性五件事全部补齐。近 900 人点赞,6.3 万人围观,社区却吵成两派——一边夸"终于补了生产级地基",一边追问"上几版的 gateway 坑到底填了没"。


五件事,一版出,官方只说了七个字


4 月 30 日早上 7:41,OpenClaw 官方在 X 上甩出一条推文,没有花哨预告,没有倒计时海报,直接列了五项更新:


  • DeepInfra provider
  • better file attachments
  • operator-managed proxy routing
  • stricter model selection + local model fixes
  • gateway, channel, and session reliability


最后一句收尾:Ships more than it brags.


翻译过来就是——交付的比吹的多。


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ OpenClaw 官方发布推文,近 900 赞,6.3 万次查看


这条推文最狠的地方,在于它完全没有给任何一项单独造势。五件事平铺直叙,更像一份工程周报,不像一份产品发布会 keynote。


但仔细看完这五项,你会发现它们有一个共同指向:全是 agent 真正跑起来之前最容易掉链子的底层环节。


DeepInfra:一个 key 挂上七种能力


先说第一项。很多人看到"新增 DeepInfra provider",第一反应可能是"哦,又多了个模型源"。


错了。


看 PR #73038 的覆盖面:动态模型发现、图像生成/编辑、媒体理解、TTS、STT、文生视频、memory embeddings——一个 API key 背后,文本、图像、音频、视频、embedding 五条能力线全挂上了。


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ 官方跟帖详解 DeepInfra 接入范围,6900+ 次查看


这里要特别说清楚:OpenClaw 没有自己发新模型。它做的是把 DeepInfra 作为一个多模态、多能力面的 provider,正式纳入内置供应商体系。对用户来说,填一个 `DEEPINFRA_API_KEY`,就能在 OpenClaw 里同时用上聊天、画图、听音频、生成视频。


以前要干这件事,你得自己对接四五个 API。现在 OpenClaw 帮你把 provider contract 一次挂全。


附件修复:以前你的文件"传了个寂寞"


第二项更新,听起来很普通——"更好的文件附件"。


但 PR #67572 里写的真实情况是这样的:


之前,Gateway RPC 的附件处理会静默丢弃所有非图片文件。


什么意思?你在 OpenClaw 里给 agent 传了一份 PDF、一个 Excel、一份日志文件,UI 上看起来传成功了,但 agent 根本没收到。系统默默把它吞了,连个错误提示都没有。


"chat.send can stage non-image attachments for agents, and WebChat/Control UI supports non-video file uploads without nuking chat state."


「现在 chat.send 可以为 agent 暂存非图片附件,WebChat/Control UI 也支持非视频文件上传,而且不会把聊天状态搞炸。」


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ 官方跟帖说明附件改进,5300+ 次查看


这次修复做了什么?


1. `parseMessageWithAttachments` 现在接受任何 MIME 类型 2. 超过 2MB 的内容会 offload 到 media store 3. 非图片附件会被路由进 `ctx.MediaPaths + ctx.MediaTypes` 4. 以前那种"文件像是传了,但 agent 其实没吃到"的情况,现在会抛出显式的 `UnsupportedAttachmentError`


对真实工作流来说,PDF、docx、xlsx、zip、日志文件、代码压缩包,才是高频需求。很多产品说"支持上传文件",其实只是做了个上传按钮,底层只认图片。OpenClaw 这次是把"传了个寂寞"变成了"真传真收"。


代理路由:OpenClaw 开始碰企业网络治理


第三项,可能是这次更新里最容易被普通用户忽略、但最让运维兴奋的一块。


PR #70044 新增了 `proxy.enabled`、`proxy.proxyUrl` 和 `OPENCLAW_PROXY_URL` 配置项,让 OpenClaw 运行时的 HTTP / WebSocket 出站流量可以走运维方指定的前向代理。


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ 官方跟帖说明代理路由机制,3800+ 次查看


几个关键约束:


  • 只接受 `http://` forward proxy listener
  • HTTPS 目标仍然通过 HTTP CONNECT 走这个代理
  • process-local HTTP / WebSocket 客户端都能跟着这套代理策略走
  • loopback Gateway bypass 保留


"runtime HTTP/WebSocket traffic through an explicit forward proxy, with strict http:// validation and loopback Gateway bypass."


「OpenClaw 开始把运行时 HTTP / WebSocket 流量认真纳入前向代理治理,同时保留回环地址绕过。」


这意味着什么?OpenClaw 开始更像一套可以接进公司网络治理体系的东西了。出站审计、SSRF 防护、合规管控——以前只能靠外部 wrapper hack 的事情,现在 runtime 层原生支持。


换个角度理解:只会调用公开 API,不等于可以上生产。真正在公司环境跑,前向代理、出站控制、审计这些东西一个都不能少。OpenClaw 这版开始认真碰这件事了。


模型选择:选了 A,别再偷偷掉到 B


第四项是"stricter model selection + local model fixes"。


这个问题很多用户踩过:在 `/model` 里选了某个模型,实际推理时却悄悄 fallback 到另一个。尤其是跑本地 Ollama 模型时,vision 模型的 fallback 逻辑经常打架。


这版的修复包括:


  • per-agent 主模型在 fallbacks 缺省时保持严格——你选了就是选了,不会偷偷掉
  • Ollama vision 模型不再穿透到默认 provider——本地模型就是本地模型,不会莫名其妙跑到云上去


对 agent 用户来说,模型选择的确定性直接影响可复现性。你调试了半天,发现跑的根本不是你选的那个模型——这种体验很伤。


可靠性:真正的版本暗线


最后一项,听起来最无聊,其实最要命。


release note 里点名的稳定性修复清单:


  • Telegram startup/sends
  • Slack socket/media stalls
  • gateway startup prewarm
  • session/history defaults
  • update sync
  • Windows restart handoffs


还有一个专门的 PR #74210,修了 Telegram WSL2 gateway stalls——给 Telegram 出站 Bot API 调用加了超时边界,防止卡死的发送动作堵住整条消息通道。


这些 bug 的共同特点是:每一个都不花哨,但每一个都能让你的 agent 在真实使用中莫名其妙死掉。网关启动慢、会话清理不彻底、通道卡死、消息堵住——这才是 agent 系统真正的死法。


社区反应:一边鼓掌,一边举手提问


推文发出后几小时,评论区迅速分成三种声音。


第一种:基建派鼓掌。


"Those are the fixes that make an always-on assistant actually survivable in day-to-day use."


「真正让一个常驻助手活过日常使用的,就是这些底层修复。」


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ @superactro 评价:代理路由和会话可靠性比花哨 headline 更重要


第二种:老用户追问旧坑。


"I'm nervous about updating from 4.23."


「从 4.23 升级?我有点慌。」


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ @jak_gotit 追问 4.24~4.26 期间的 gateway 问题是否已修复,22 条回复,41 赞


这说明 reliability 从来就不是文案词。用户是真的被前几版折腾出了升级 PTSD。


第三种:直接吐槽发布面。


"All links are broken 404"


OpenClaw 一口气补了五块地基,官方只甩了一句:「交付的比吹的多」!


▲ @h1kz0r 反馈所有文档链接 404


人工核验也确实撞到了同样的问题——`openclaw.ai/providers/deepinfra`、`/security/network-proxy`、`/web/webchat` 几个页面在发布后一段时间内打不开。


工程进步是真的,发布面冒烟也是真的。


时间线:先合代码,再发版,最后才发推


从 PR 合并时间看,这次发版的节奏很清晰:


  • 4 月 28 日:三个核心 PR 先后合并——DeepInfra provider、非图片附件、代理路由
  • 4 月 29 日 22:12 UTC:GitHub release `v2026.4.27` 正式发布
  • 4 月 30 日 07:41:X 线程开始对外叙事


代码先落地,release 再打包,推文最后发。这说明版本的底子是工程驱动的,不是先写好推文再倒推功能。


这版的真正意义:从"模型入口"到"agent 运行时"


如果把这五项更新放到一起看,你会发现 OpenClaw 正在完成一次身份转变。


对普通聊天产品来说,模型是核心;但对 agent 框架来说,真正决定"能不能上手干活"的是四件事:


1.模型接入够不够灵活——DeepInfra 补了这块 2.文件能不能进上下文——附件修复补了这块 3.出站流量可不可控——代理路由补了这块 4.消息链路会不会死掉——可靠性修复补了这块


这四件事,恰好是 agent 从 demo 走向生产前最容易掉链子的地方。


OpenClaw 这版没端出新大模型,没搞发布会,没有倒计时。它做的事情更像是——把 agent 真正跑起来之前的地基,一块一块铺平。


当然,地基铺得快,发布面也确实冒了几个烟。文档链接 404、老用户对 gateway 的信任还没完全修复——这些问题说明 OpenClaw 现在更像一个日更速度极猛、同时还在硬修生产坑的高速进化型项目


官方自己也知道这个状态。所以它没说"我们很完美",它说的是:


Ships more than it brags.


交付的比吹的多。这句话,既是这版的底气,也是这版的边界。


文章来自于微信公众号 "虾图灵",作者 "虾图灵"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales