AI资讯新闻榜单内容搜索-Experience

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Experience
强化学习教父重出江湖, 生成式AI的时代要结束了?

强化学习教父重出江湖, 生成式AI的时代要结束了?

强化学习教父重出江湖, 生成式AI的时代要结束了?

过去两年,AI靠模仿人类席卷世界。但强化学习之父Richard Sutton却说:「GenAI的时代正在结束。」他带着图灵奖的荣光,加入一家几乎没人听过的公司——ExperienceFlow.AI,他要让AI不靠人类数据喂养,而靠「经验」觉醒。

来自主题: AI资讯
8075 点击    2025-11-07 15:04
无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

Meta提出早期经验(Early Experience)让代理在无奖励下从自身经验中学习:在专家状态上采样替代动作、执行并收集未来状态,将这些真实后果当作监督信号。核心是把“自己造成的未来状态”转为可规模化的监督。

来自主题: AI技术研报
8280 点击    2025-10-20 11:54
刚刚,Meta风雨飘摇中发了篇重量级论文,作者几乎全是华人

刚刚,Meta风雨飘摇中发了篇重量级论文,作者几乎全是华人

刚刚,Meta风雨飘摇中发了篇重量级论文,作者几乎全是华人

风雨飘摇中的Meta,于昨天发布了一篇重量级论文,提出了一种被称作「早期经验」(Early Experience)的全新范式,让AI智能体「无师自通」,为突破强化学习瓶颈提供了一种新思路。

来自主题: AI技术研报
8638 点击    2025-10-12 11:01
AI X 用户研究:能并行千场访谈的“超级研究员”,正重塑产品决策的未来

AI X 用户研究:能并行千场访谈的“超级研究员”,正重塑产品决策的未来

AI X 用户研究:能并行千场访谈的“超级研究员”,正重塑产品决策的未来

用户体验研究(UXR,User Experience Research)是驱动企业增长的引擎,但核心流程却高度依赖人工。从收集数据、分析客户需求、再到测试产品,需要一段很长的时间线,这个过程常常出现 “企业想做的” 与 “用户真正需要的” 之间的脱节。

来自主题: AI资讯
6455 点击    2025-09-30 16:16
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds

Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助“经验”这一媒介,这里的“经验”就是指强化学习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。

来自主题: AI资讯
7640 点击    2025-06-14 12:58
Liblib 悄咪咪在海外做了“首个设计 Agent”

Liblib 悄咪咪在海外做了“首个设计 Agent”

Liblib 悄咪咪在海外做了“首个设计 Agent”

Design is not just a task-it's an experience. 设计不仅仅是一项任务,更是一种体验。——LovartAI

来自主题: AI资讯
10017 点击    2025-05-14 13:55
谷歌联合强化学习之父:通过经验学习的4大核心,Agent将获得超人能力 |最新战略瞭望

谷歌联合强化学习之父:通过经验学习的4大核心,Agent将获得超人能力 |最新战略瞭望

谷歌联合强化学习之父:通过经验学习的4大核心,Agent将获得超人能力 |最新战略瞭望

本文对DeepMind两位泰斗级科学家David Silver和Richard Sutton的重磅论文《Welcome to the Era of Experience》进行了深度解读,我将其视为AI发展方向的一份战略瞭望图。

来自主题: AI技术研报
8159 点击    2025-04-22 08:43