AI资讯新闻榜单内容搜索-RL

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: RL

具身智能，究竟还缺什么？

具身智能，究竟还缺什么？

具身智能，究竟还缺什么？

本期AGI路线图中关键节点：Figure 02、Optimus Gen-2、宇树G1、傅利叶GR-2、众擎SE01、BVS、WonderWorld、ReKep、DrEureka、DeepMind足球机器人、腾讯「小五」、达芬奇AI机器人、Project GR00T、LeRobot。

来自主题: AI资讯

4448 点击 2024-11-13 09:36

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行，展示了机器人学习领域的前沿研究和发展，尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报

6939 点击 2024-11-12 17:33

聚焦「视听触感官」协同配合的具身精细操纵，人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵，人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵，人大胡迪团队领衔探索机器人模态时变性挑战

中国人民大学高瓴人工智能学院 GeWu 实验室、朝闻道机器人和 TeleAI 最近的合作研究揭示并指出了 “模态时变性”（Modality Temporality）现象，通过捕捉并刻画各个模态质量随物体操纵过程的变化，提升不同信息在具身多模态交互的感知质量，可显著改善精细物体操纵的表现。论文已被 CoRL2024 接收并选为 Oral Presentation。

来自主题: AI技术研报

4492 点击 2024-11-08 19:26

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

让 LLM 在自我进化时也能保持对齐。

来自主题: AI技术研报

6150 点击 2024-11-05 14:44

打破RLHF瓶颈，克服奖励欺骗！Meta发布全新后训练方式CGPO，编程水平直升5%

打破RLHF瓶颈，克服奖励欺骗！Meta发布全新后训练方式CGPO，编程水平直升5%

打破RLHF瓶颈，克服奖励欺骗！Meta发布全新后训练方式CGPO，编程水平直升5%

CGPO框架通过混合评审机制和约束优化器，有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题，显著提升了语言模型在多任务环境中的表现。CGPO的设计为未来多任务学习提供了新的优化路径，有望进一步提升大型语言模型的效能和稳定性。

来自主题: AI技术研报

3937 点击 2024-11-01 14:54

吞吐量最高飙升20倍！豆包大模型团队开源RLHF框架，破解强化学习训练部署难题

吞吐量最高飙升20倍！豆包大模型团队开源RLHF框架，破解强化学习训练部署难题

吞吐量最高飙升20倍！豆包大模型团队开源RLHF框架，破解强化学习训练部署难题

强化学习（RL）对大模型复杂推理能力提升有关键作用，然而，RL 复杂的计算流程以及现有系统局限性，也给训练和部署带来了挑战。

来自主题: AI技术研报

4684 点击 2024-11-01 14:50

强化学习之父Richard Sutton给出一个简单思路，大幅增强所有RL算法

强化学习之父Richard Sutton给出一个简单思路，大幅增强所有RL算法

强化学习之父Richard Sutton给出一个简单思路，大幅增强所有RL算法

在奖励中减去平均奖励

来自主题: AI技术研报

7974 点击 2024-11-01 12:43

强化学习训练一两个小时，100%自主完成任务：机器人ChatGPT时刻真来了？

强化学习训练一两个小时，100%自主完成任务：机器人ChatGPT时刻真来了？

强化学习训练一两个小时，100%自主完成任务：机器人ChatGPT时刻真来了？

把平均成功率从 50% 拉到了 100%。

来自主题: AI资讯

9106 点击 2024-10-29 13:46

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成，比现有技术快100倍

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成，比现有技术快100倍

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成，比现有技术快100倍

斯坦福吴佳俊团队与MIT携手打造的最新研究成果，让我们离实时生成开放世界游戏又近了一大步。

来自主题: AI技术研报

8680 点击 2024-10-26 22:20

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

西安电子科大、上海AI Lab等提出多模态融合检测算法E2E-MFD，将图像融合和目标检测整合到一个单阶段、端到端框架中，简化训练的同时，提升目标解析性能。相关论文已入选顶会NeurlPS 2024 Oral，代码、模型均已开源。

来自主题: AI技术研报

5090 点击 2024-10-25 10:56

上一页当前第29页,共38页下一页