自动学会工具解题,RL扩展催化奥数能力激增17% 自动学会工具解题,RL扩展催化奥数能力激增17% 关键词: AI,ToRL,模型训练,人工智能 在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。 来自主题: AI技术研报 8977 点击 2025-04-02 10:09