AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
让多视角图像生成更轻松!北航和VAST推出MV-Adapter

让多视角图像生成更轻松!北航和VAST推出MV-Adapter

让多视角图像生成更轻松!北航和VAST推出MV-Adapter

最近,2D/3D 内容创作、世界模型(World Models)似乎成为 AI 领域的热门关键词。作为计算机视觉的基础任务之一,多视角图像生成是上述热点方向的技术基础,在 3D 场景生成、虚拟现实、具身感知与仿真、自动驾驶等领域展现了广泛的应用潜力。

来自主题: AI技术研报
6977 点击    2024-12-18 14:31
NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架

NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架

NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架

现如今,以 GPT 为代表的大语言模型正深刻影响人们的生产与生活,但在处理很多专业性和复杂程度较高的问题时仍然面临挑战。在诸如药物发现、自动驾驶等复杂场景中,AI 的自主决策能力是解决问题的关键,而如何进行决策大模型的高效训练目前仍然是开放性的难题。

来自主题: AI技术研报
7307 点击    2024-12-18 09:47
李飞飞:World Labs这样实现「空间智能」

李飞飞:World Labs这样实现「空间智能」

李飞飞:World Labs这样实现「空间智能」

遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。

来自主题: AI资讯
7182 点击    2024-12-13 15:05
反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

传闻反转了,Claude 3.5 Opus没有训练失败。 只是Anthropic训练好了,暗中压住不公开。 semianalysis分析师爆料,Claude 3.5超大杯被藏起来,只用于内部数据合成以及强化学习奖励建模。 Claude 3.5 Sonnet就是如此训练而来。

来自主题: AI资讯
6242 点击    2024-12-12 15:03
深度对比: SFT、ReFT、RHLF、RLAIF、DPO、PPO

深度对比: SFT、ReFT、RHLF、RLAIF、DPO、PPO

深度对比: SFT、ReFT、RHLF、RLAIF、DPO、PPO

最近OpenAI Day2展示的demo可能把ReFT带火了。实际上这不是一个很新的概念,也不是OpenAI原创的论文。 接下来,本文对比SFT、ReFT、RHLF、DPO、PPO这几种常见的技术。

来自主题: AI技术研报
8114 点击    2024-12-10 15:01
SWIRL:有望成为2025年顶级AI搜索引擎

SWIRL:有望成为2025年顶级AI搜索引擎

SWIRL:有望成为2025年顶级AI搜索引擎

现在几乎每家公司都会有内部文档系统,如阿里的语雀、钉钉,字节的飞书,Confluence,印象笔记等等都可以提供给B端在局域网部署。因此,如果能把搜索功能做得高效,就能提高自家产品的竞争力。

来自主题: AI资讯
7116 点击    2024-12-09 15:28
OpenAI的强化微调:RL+Science 创造新神还是灭霸?

OpenAI的强化微调:RL+Science 创造新神还是灭霸?

OpenAI的强化微调:RL+Science 创造新神还是灭霸?

2024 年 12 月 6 号加州时间上午 11 点,OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。对于特定领域的决策问题,比如医疗诊断、罕见病诊断等等,只需要上传几十到几千条训练案例,就可以通过微调来找到最有的决策。

来自主题: AI技术研报
6934 点击    2024-12-08 14:19
语言已显苍白,欢迎着陆AI大世界模型

语言已显苍白,欢迎着陆AI大世界模型

语言已显苍白,欢迎着陆AI大世界模型

作为计算机视觉领域的开拓者,李飞飞在人工智能革命中扮演了重要角色。她的新回忆录《我所看到的世界》(The Worlds I See)详细讲述了她从学术到技术突破的旅程,以及如何在人工智能的最前沿找到自己的使命。

来自主题: AI资讯
6413 点击    2024-12-08 12:14
LeCun团队新作:在世界模型中导航

LeCun团队新作:在世界模型中导航

LeCun团队新作:在世界模型中导航

最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。

来自主题: AI技术研报
6357 点击    2024-12-07 15:18
突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架

突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架

突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架

在人工智能发展史上,强化学习 (RL) 凭借其严谨的数学框架解决了众多复杂的决策问题,从围棋、国际象棋到机器人控制等领域都取得了突破性进展。

来自主题: AI技术研报
7216 点击    2024-12-07 15:11