AI资讯新闻榜单内容搜索-学习智能体

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 学习智能体

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

最近，前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT（高效微调）的研究结果，似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中，PEFT 不再是对大模型全参数后训练的一种廉价平替，更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报

9656 点击 2026-06-02 12:25

ICML 2026｜传统UED瓶颈被打破，强化学习也能精准定位「最近发展区」

ICML 2026｜传统UED瓶颈被打破，强化学习也能精准定位「最近发展区」

ICML 2026｜传统UED瓶颈被打破，强化学习也能精准定位「最近发展区」

训练强化学习智能体时，一个常见问题是：有些 level 太简单，智能体跑几遍就会；有些 level 又太难，智能体几乎得不到有效反馈。前者只是在重复已有能力，后者则会把训练预算消耗在无效探索上。真正有价值的训练环境，往往位于二者之间。

来自主题: AI技术研报

9349 点击 2026-05-22 08:45

专访丨华人本科生打造学习 Agent，获真格 100 万美元投资

专访丨华人本科生打造学习 Agent，获真格 100 万美元投资

专访丨华人本科生打造学习 Agent，获真格 100 万美元投资

这是一款由在校生团队打造的通用学习智能体：可以深度解题、拆开讲清抽象概念，又能从上百页课件、文献里提炼出 cheatsheet、闪卡和练习题，还会记住每个用户的学习方式，像一个长期陪伴在身边的私人老师。

来自主题: AI资讯

11743 点击 2025-11-20 10:55

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶Atari 100K

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶Atari 100K

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶Atari 100K

DIAMOND是一种新型的强化学习智能体，在一个由扩散模型构建的虚拟世界中进行训练，能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中，DIAMOND的平均得分超越了人类玩家，证明了其在模拟复杂环境中处理细节和进行决策的能力。

来自主题: AI技术研报

7253 点击 2024-11-18 15:24

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

打造终身学习智能体，是研究界以来一直追求的目标。最近，帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体（DAAG），利用LLM+VLM+DM三大模型，让AI完成迁移学习、高效探索。

来自主题: AI资讯

4784 点击 2024-08-07 19:06

世界模型也扩散！训练出的智能体竟然不错

世界模型也扩散！训练出的智能体竟然不错

世界模型也扩散！训练出的智能体竟然不错

在图像生成领域占据主导地位的扩散模型，开始挑战强化学习智能体。

来自主题: AI技术研报

11398 点击 2024-05-24 11:22

上一页当前第1页,共1页下一页