AI资讯新闻榜单内容搜索-模型

上海交大DENG Lab提出「LatentUM」：Unified Model的真正「战场」在视觉推理与世界模型

过去一段时间，生成理解统一模型（Unified Model）经常被理解成一种「既能看懂图、又能生成图」的多模态通用系统。

来自主题: AI技术研报

8626 点击 2026-04-14 08:42

统一VLA范式！港科大开源StarVLA乐高式架构，复现成本大幅降低

当前具身智能的VLA（Vision-Language-Action）赛道正陷入典型的「碎片化」泥潭：不同团队采用异构的动作解码范式、强耦合的数据管线、互不兼容的评测协议，导致方法难以横向对比，复现成本极高。

来自主题: AI技术研报

9163 点击 2026-04-14 08:42

港大×复旦×上交：视触觉融合+闭环纠错，让机器人双臂协作不再「盲操」

在具身智能快速发展的今天，高质量数据已成为驱动能力提升的关键基础，然而一个核心问题也随之而来：如何让机器人数据采集更快、更稳、更有效？

来自主题: AI技术研报

6168 点击 2026-04-14 08:41

准确回答视频细节！11B模型挑战视频理解「证据级」任务，开源可商用

让一个模型概括“这是一段什么视频”，并不难。

来自主题: AI技术研报

6167 点击 2026-04-14 08:41

Claude强到不敢发的Mythos，被质疑用了字节Seed技术

Claude最强“神话”模型，可能用到来自字节的技术？

来自主题: AI技术研报

6385 点击 2026-04-13 15:05

Z Tech｜我们与开源顶流实验室一起聊了聊 Harness Design

过去一年，大模型的能力曲线几乎是指数上升的——推理更强、工具调用更稳、上下文窗口越撑越大。但一个越来越尖锐的问题也随之浮出水面：模型变强了，可承接它的那层东西在哪？

来自主题: AI资讯

9199 点击 2026-04-13 15:03

全球第一，13个SOTA！我们找到了龙虾界掌管GUI的神

有没有想过让「龙虾」替你打麻将？

来自主题: AI技术研报

6905 点击 2026-04-13 15:02

日嫖1000次！Qwen3.6反代API接入任意工具

昨天我发现 Qwen3.6“倒反天罡”。

来自主题: AI技术研报

8882 点击 2026-04-13 15:02

挤干大模型高分「水分」！最强模型仅49分，南大傅朝友发布Video-MME-v2

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及 3300 + 人工时高质量标注，揭示模型与人类的巨大鸿沟（49 vs 90）、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。

来自主题: AI技术研报

10610 点击 2026-04-13 15:01

国内首个！加入六维力的全感知数采，让VLA模型进化出力触觉

这个月，具身智能领域又卷出新高度：硅谷独角兽公司 Generalist AI 发布全新一代基础模型 GEN-1，将机器人包装手机、折纸箱这些活的平均成功率直接拉到了创纪录的 99%，折纸箱的速度更是飙到了以前的三倍（34s vs 12.1s）。

来自主题: AI资讯

8508 点击 2026-04-13 14:33