AI资讯新闻榜单内容搜索-DiT

A²-Edit：突破物体类别与掩码精度限制，实现精准参考图编辑

上海交通大学联合上海创智学院团队提出 A²-Edit，它以统一框架支持任意物体类别和任意精度掩码，通过混合 Transformer 专家路由、掩码退火训练及 50 万级多品类数据，让用户只需给出粗略区域，也能完成身份一致、结构完整、自然融合的参考图引导局部编辑。

来自主题: AI技术研报

6590 点击 2026-08-01 10:44

ECCV2026｜4步去噪实现12.66 FPS，清华、港科大提出实时流式视频编辑框架LiveEdit

近日，清华大学与香港科技大学的研究团队提出 LiveEdit，一种面向通用文本指令的实时流式视频编辑框架。该方法以因果、分块的方式处理持续到来的视频，在 4 步 / 视频块的推理条件下实现 12.66 FPS 的流式编辑，并能保持被编辑区域的准确性以及未编辑区域的一致性。

来自主题: AI技术研报

7371 点击 2026-08-01 10:44

神秘黑马-莫刻机器人冲榜WorldArena，仅32张真武810E封神

机器人实验室里，这样的画面总是反复出现：屏幕上模拟的机械臂正以完美轨迹移动，但真实世界的一边，玻璃杯还待在桌面上，甚至已被夹爪打翻。

来自主题: AI技术研报

8301 点击 2026-07-30 16:56

WAIC直击：200家机器人企业同场竞技，但物理AI的入场券属于闭环玩家

在今天上午结束的「AI 进入物理世界」京东分论坛上，其对外集中展示了这套布局。除了首次集体亮相的 JoyAI 全系列大模型矩阵，具身数据采集体系、JoyInside 智能硬件和京东云 AI 基础设施也一同亮相，它们连同全链路业务场景组成了京东的物理 AI 闭环。

来自主题: AI资讯

10023 点击 2026-07-19 10:13

机器人需要「看到三维未来」！RynnWorld-4D重塑4D具身世界模型

近两年，视频生成模型在具身智能领域受到持续关注。从 UniPi、SuSIE 到各类 action-conditioned video generation 变体，其核心思路一致：先由模型生成一段未来视频，再从中提取动作信号供机器人执行。

来自主题: AI技术研报

9717 点击 2026-07-17 10:12

Loop 的工程讨论够多了，Loop 理念的产品应该长什么样？

前阶跃 Agent 产品负责人钟十六最近的一篇文章，尝试从产品视角回答这个问题。他描绘了一个 Loop 成熟后的未来图景，Agent 将成为自行运转的项目中心，人只需要在关键时刻现身拍板。在他看来，Loop 真正的价值不在于会重复跑任务，而在于它会带着你的每一次判断持续成长，一轮轮变成更懂你的系统，最终沉淀为长期运转的资产。

来自主题: AI资讯

8726 点击 2026-07-12 10:51

ICML 2026 | 图像编辑进入「交互理解」时代，北大提出HOI-Edit基准与SCPE自纠错框架

本文发现图生视频（I2V）模型天然适合重构动态交互过程，并提出 SCPE（Self-Correcting Process Editing）多智能体系统自纠错框架：利用视频生成过程暴露失败原因，再通过分析、反思和工具书更新迭代增强提示，使 I2V 模型在复杂 HOI 编辑中显著提升交互准确性与推理能力。

来自主题: AI技术研报

9024 点击 2026-07-11 11:15

最适合机器人的视频基座模型，被中国团队开源了

蚂蚁灵波选择了后一条路：开源 LingBot-Video。这是一个面向具身智能的视频生成基座模型，也是一套专为机器人场景设计的 DiT 视频预训练范式。通用视频模型更多学习画面变化、镜头运动和视觉风格；LingBot-Video 则把重点放在动作、任务、交互和物理环境变化上，面向世界预测、动作理解和机器人训练构建视频生成基座。

来自主题: AI技术研报

8598 点击 2026-07-10 10:41

刚刚，Claude Fable 5续命5天！省钱攻略来了

7月7日，Fable 5没下线！就在凌晨，Anthropic突然官宣，最强Claude Fable 5限时免费，延长到了7月12日。比原计划，又多了足足五天的「白嫖」时间。具体用法，和之前一模一样，每周使用限额50%，超出之后想继续用，就得买credits了。

来自主题: AI资讯

8764 点击 2026-07-08 09:35

Reddit一张神图疯传！2年后，你的笔记本就能跑Fable 5

两年后，Fable 5 级 AI，可能就躺在你的笔记本里。就在昨天，全球最大的本地大模型社区r/LocalLLaMA，一张图刷屏了整个AI圈——标题简单粗暴：如果趋势持续，Mythos级能力可能在2年内运行在高端消费级硬件上。

来自主题: AI资讯

8941 点击 2026-07-07 10:27