AI资讯新闻榜单内容搜索-强化学习

人形机器人优雅漫步，强化学习新成果！独角兽Figure创始人：之前大家吐槽太猛

注意看，机器人像人一样从容地走出大门了！人形机器人独角兽Figure，再次带来他们的新成果——利用强化学习实现自然人形行走。跟之前版本的机器人相比，确实更像人了许多，而且步态更加轻盈，速度也更快。

来自主题: AI资讯

8456 点击 2025-03-26 21:18

强化学习也涌现？自监督RL扩展到1000层网络，机器人任务提升50倍

虽然大多数强化学习（RL）方法都在使用浅层多层感知器（MLP），但普林斯顿大学和华沙理工的新研究表明，将对比 RL（CRL）扩展到 1000 层可以显著提高性能，在各种机器人任务中，性能可以提高最多 50 倍。

来自主题: AI技术研报

7809 点击 2025-03-22 15:55

Atlas机器人越来越像人了！强化学习加持爬行、翻跟头、跳街舞，已安排进厂打工

波士顿动力的Atlas机器人又双叒叕来了！从最初的液压「电缆尾巴」到现在全电动AI增强版，这个机器人不仅会翻跟头、跳街舞，还学会了倒立侧翻，甚至开始「进厂打工」搬零件。动作捕捉技术与强化学习的加持，让Atlas的动作越来越像人类，而它的目标也从炫技转向实用。

来自主题: AI资讯

8108 点击 2025-03-20 17:24

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

11177 点击 2025-03-20 09:48