AI资讯新闻榜单内容搜索-ToRL

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: ToRL

自动学会工具解题，RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中，工具使用一直是克服语言模型计算局限性的关键路径。不过，当今的大模型在使用工具方面还存在一些局限，比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。

来自主题: AI技术研报

10289 点击 2025-04-02 10:09