当你还在训练大模型,他们已经教AI“画”出了App
当你还在训练大模型,他们已经教AI“画”出了App一篇让你看懂的AGenUI开源解读
搜索
一篇让你看懂的AGenUI开源解读
微信现支持一键转发百条消息到元宝。
凌晨 1 点,某三甲医院急诊科,一位 62 岁的男性被紧急送入,他正经历急性 STEMI 并发急性心衰。血压飙至 185/105 mmHg,血氧仅 91%。护士已推来除颤仪,催促医生「心电捕手」确认替格瑞洛剂量。
一位网友准备退订机票,为了省事,他直接询问了AI助手“豆包”退票的手续费标准。AI信誓旦旦地告诉他:“手续费只有5%”。这位网友信以为真,果断点击了退票。然而结算时他才发现,真实的退票费高达40%,直接被扣了600多块钱。
DAA:智能体时代的新价值逻辑。
这两天打开X,发现一个开源项目刷屏了——Hyperframes。GitHub上两天干了17.4k star,1.6k fork,Codex、Cursor、Claude Code的插件全线覆盖。
就在刚刚,蚂蚁集团旗下具身智能公司灵波科技传出新动作—— 全面开源其具身基座模型LingBot-VLA的真机后训练工具链。
您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?
一群人,一群 AI,一起玩。
当下的大模型后训练(Post-training)pipeline 中,On-Policy Distillation(OPD)已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5,业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习(RL)稀疏的结果奖励,OPD 提供了密集的 Token 级别监督信号,看起来就像是一顿「免费的午餐」。