AI资讯新闻榜单内容搜索-LaST

PEFT方法评测不能只看下游分：通用能力损失也该被量化

近期，来自香港中文大学、西湖大学、德国马普所等机构的研究者提出了 PEFT-Arena —— 一个从稳定性‑可塑性权衡（stability–plasticity trade-off）视角重新审视 PEFT 方法的评测基准与分析框架。该工作已在 ICLR 2026 相关 workshop 上进行了展示，并开源了完整代码。

来自主题: AI技术研报

9778 点击 2026-06-14 10:38

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

刚刚，UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上，让它们干真正的活——在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。

来自主题: AI技术研报

8962 点击 2026-06-13 10:41

分享3个让Agent效果翻倍、Token成本砍半的开源项目！

某天，老板让你用 Agent 手搓个自动化流程的小工具，你袖子一撸，信心满满地开干。

来自主题: AI资讯

6388 点击 2026-06-11 10:45

「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手：把论文从 PDF 改写成 AI 能直接执行的研究包

我们今天以 PDF 写论文的方式，已经持续了三百多年。然而论文其实是把一段混乱反复、充满试错的真实研究，讲成一个干净利落、足以服人的完美故事。

来自主题: AI技术研报

9880 点击 2026-06-05 09:25

具身大模型R1时刻：LIBERO终结者，99.9%背后的物理推理新范式

机器人拉个拉链，到底需不需要“脑子”？

来自主题: AI技术研报

7809 点击 2026-05-11 16:10

2026 年做搜索就是做 Agent Memory

4 月 18 日，Elastic 中国 AI 搜索技术大会在北京召开。以下内容整理自 Elastic 全球副总裁肖涵，原 Jina AI 创始人兼 CEO 在会上的演讲。肖涵讲述了 AI 搜索的发展历程以及为什么说在 2026 年做 AI 搜索基本就是在做智能体记忆 (Agent Memory)。

来自主题: AI技术研报

10212 点击 2026-04-22 16:40

Last30Days：GitHub 一天狂涨 3000 星的「终局情报 Skill」，一文看懂如何配置

前天，我刷 GitHub Trending 的时候，看到第一名是个叫Last 30 Days的项目。

来自主题: AI技术研报

9822 点击 2026-03-31 15:30

具身大模型LaST₀：双臂/移动/灵巧手全面新SOTA，首次引入隐空间时空思维链

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

6972 点击 2026-02-08 11:50

会议软件Zoom也来搞AI了，称在AI最难考试上“击败”了Gemini 3

最近，视频会议软件公司 Zoom 发布了一条出人意料的消息：他们宣称在“人类最后的考试”（Humanity s Last Exam，简称 HLE）这个号称当前 AI 领域最具挑战性的基准测试上，取得了 48.1％的成绩，比此前由 Google Gemini 3 Pro（带工具）保持的 45.8％高出 2.3 个百分点。

来自主题: AI资讯

8404 点击 2025-12-15 17:26

公告：Elastic (NYSE: ESTC) 完成对Jina AI的收购

纽约时间 2025 年 10 月 9 日早上 9 点，Elastic (NYSE: ESTC) 在其官网宣布完成了对 Jina AI 的收购。ina AI 原 CEO 肖涵将在 Elastic 担任 VP of AI，负责 AI 方向的战略和研发。由肖涵带领的核心Jina团队将继续在向量模型、重排器、Reader 和小模型上推进搜索 AI 的发展。

来自主题: AI资讯

10529 点击 2025-10-10 13:12