AI资讯新闻榜单内容搜索-LaPha

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LaPha

LaPha：你的Agent轨迹其实嵌入在一个Poincaré球？

在经典强化学习问题中，动作空间通常是离散且有限的。例如在围棋中，一步棋就是一次行动；在机器人控制或视觉 - 语言 - 行动（VLA）模型中，动作往往来自一个有限的控制指令集合。

来自主题: AI技术研报

6635 点击 2026-03-18 14:54