AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!
AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!UC Berkeley、UW、AI2 等机构联合团队最新工作提出:在恰当的训练范式下,强化学习(RL)不仅能「打磨」已有能力,更能逼出「全新算法」级的推理模式。他们构建了一个专门验证这一命题的测试框架 DELTA,并观察到从「零奖励」到接近100%突破式跃迁的「RL grokking」现象。
搜索
UC Berkeley、UW、AI2 等机构联合团队最新工作提出:在恰当的训练范式下,强化学习(RL)不仅能「打磨」已有能力,更能逼出「全新算法」级的推理模式。他们构建了一个专门验证这一命题的测试框架 DELTA,并观察到从「零奖励」到接近100%突破式跃迁的「RL grokking」现象。
昨天刚发了飞书多维表格的使用教程,没想到,反响非常不错。 数据都非常的好,被转发了4500多次。。。 然后有很多朋友在下面评论,除了让我写爬虫教程之外,就是问,飞书除了多维表格之外,还有什么牛逼的用法
前vivo「最美产品经理」宋紫薇,AI创业细节进一步曝光了。量子位获悉,已经入局AI智能硬件赛道创业的宋紫薇,瞄准的是「AI化妆镜」。公开信息显示,薇光点亮成立于2024年11月,自一开始便将目光瞄向了AI硬件——并且还是“时尚”和“年轻”的硬件。
今年,流匹配无疑是机器人学习领域的大热门:作为扩散模型的一种优雅的变体,流匹配凭借简单、好用的特点,成为了机器人底层操作策略的主流手段,并被广泛应用于先进的 VLA 模型之中 —— 无论是 Physical Intelligence 的 ,LeRobot 的 SmolVLA, 英伟达的 GR00T 和近期清华大学发布的 RDT2。
现有视觉语言大模型(VLMs)在多模态感知和推理任务上仍存在明显短板:1. 对图像中的细粒度视觉信息理解有限,视觉感知和推理能力未被充分激发;2. 强化学习虽能带来改进,但缺乏高质量、易扩展的 RL 数据。
当特斯拉、Figure还在发量产蓝图时,中国公司已率先量产独特的绳驱AI机器人,并进入科研商业应用。IROS 2025顶会上,他们以跨国遥操和半身机器人新品引发关注。「Design for AI」的长期主义设计哲学,也获《Nature》报道认可。
大语言模型(LLM)不仅在推动通用自然语言处理方面发挥了关键作用,更重要的是,它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性,但在下游任务中高效部署仍面临重大挑战。
2025 年 10 月,国际数据公司(International Data Corporation,IDC)发布了《中国 AI 翻译技术评估》报告。这份以“大模型驱动 AI 翻译能力全面换新”为主题的报告指出,大模型技术的全面渗透正在深刻重塑 AI 翻译市场。
“我有两张券,分别为满1000减140、满2000减280,我看中商品的价格分别为……分两次结算怎么凑单最划算?”双11开启后,在社交平台上,有人向Deepseek抛出这个问题。
近日刚好得了空闲,在研读 Anthropic 官方技术博客和一些相关论文,主题是「Agent 与 Context 工程」。2025 年 6 月以来,原名为「Prompt Engineering」的提示词工程,在 AI Agent 概念日趋火热的应用潮中,