AI资讯新闻榜单内容搜索-πRL

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: πRL

RLinf上新πRL：在线强化学习微调π0和π0.5

近年来，基于流匹配的 VLA 模型，特别是 Physical Intelligence 发布的 π0 和 π0.5，已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布，能够生成高维且平滑的连续动作序列，在应对复杂操控任务时展现出显著优势。

来自主题: AI技术研报

11816 点击 2025-11-07 10:17