AI资讯新闻榜单内容搜索-模型

日嫖1000次！Qwen3.6反代API接入任意工具

昨天我发现 Qwen3.6“倒反天罡”。

来自主题: AI技术研报

8334 点击 2026-04-13 15:02

挤干大模型高分「水分」！最强模型仅49分，南大傅朝友发布Video-MME-v2

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及 3300 + 人工时高质量标注，揭示模型与人类的巨大鸿沟（49 vs 90）、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。

来自主题: AI技术研报

10233 点击 2026-04-13 15:01

国内首个！加入六维力的全感知数采，让VLA模型进化出力触觉

这个月，具身智能领域又卷出新高度：硅谷独角兽公司 Generalist AI 发布全新一代基础模型 GEN-1，将机器人包装手机、折纸箱这些活的平均成功率直接拉到了创纪录的 99%，折纸箱的速度更是飙到了以前的三倍（34s vs 12.1s）。

来自主题: AI资讯

8223 点击 2026-04-13 14:33

Kimi Beta内测模型实测，提升明显！

刚测完 Kimi K2.5，就拿到 Beta 版内测模型了。一点喘息的机会都不给啊~~

来自主题: AI产品测评

7434 点击 2026-04-13 14:32

迎接范式革命：最新、最全的大模型Latent Space综述，NUS、复旦、清华等联合出品

从 2024 年底的关于潜在空间的早期探索，再到 2025 年底和 2026 年初的相关研究爆发，潜空间范式正在彻底重塑大模型 (LLMs, VLMs, VLAs 等延伸模型) 的底层设计逻辑。

来自主题: AI技术研报

7331 点击 2026-04-13 14:31

Harness 刚火，可能就要成为过去时了｜Hao好聊论文

随着任务的复杂度提升，Agent（智能体）的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中，模型迷糊了，于是开始跳步、忽视、绕道。

来自主题: AI技术研报

8010 点击 2026-04-13 13:51

CVPR 2026 | 摆脱相机依赖！M4Human推动毫米波人体感知迈向新阶段

想象几个并不遥远的场景：医院的病房里，刚做完手术的患者正在练习下床、走动，智能系统通过摄像头捕捉他的动作，判断步态是否稳定、有没有跌倒风险；回到家，在卧室或浴室这样私密的空间里，老人起身、转身、洗漱，甚至意外滑倒的瞬间，也可能被视觉传感器记录，只为了让 AI 能更早发现异常；

来自主题: AI技术研报

8587 点击 2026-04-13 13:50

大佬深度解析：Coding Agent的底层运行逻辑是什么？

在本文中，我将探讨编码智能体（coding agents）及其智能体编排（agent harnesses）的整体设计：它们究竟是什么、工作原理如何，以及在实际应用中各组件是如何协同运作的。

来自主题: AI技术研报

7578 点击 2026-04-13 13:50

南大团队直击大模型高分神话：人类90分，最强模型仅49分

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在Google Gemini评测团队邀约下推出视频理解新基准Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及3300+人工时高质量标注，揭示模型与人类的巨大鸿沟（49vs90）、传统Acc指标虚高、以及「Thinking」并非总是增益等现象。

来自主题: AI技术研报

7759 点击 2026-04-13 13:48

软银攒局的日本“物理AI国家队” 能打破创新困局吗?

今日（4月12日）上午，软银、NEC等多家日企联合组建国家级AI产业联盟，发力物理AI。

来自主题: AI资讯

6783 点击 2026-04-13 11:22