一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory 一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory 关键词: AI,模型训练,人工智能,360-LLaMA-Factory 大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。 来自主题: AI技术研报 7260 点击 2025-01-11 13:45