多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoToolsOctoTools通过标准化工具卡和规划器,帮助LLMs高效完成复杂任务,无需额外训练。在16个任务中表现优异,比其他方法平均准确率高出9.3%,尤其在多步推理和工具使用方面优势明显。
OctoTools通过标准化工具卡和规划器,帮助LLMs高效完成复杂任务,无需额外训练。在16个任务中表现优异,比其他方法平均准确率高出9.3%,尤其在多步推理和工具使用方面优势明显。
为了解决视频编辑模型缺乏训练数据的问题,本文作者(来自香港中文大学、香港理工大学、清华大学等高校和云天励飞)提出了一个名为 Señorita-2M 的数据集。该数据集包含 200 万高质量的视频编辑对,囊括了 18 种视频编辑任务。
本文是白鲸出海与联合非凡产研推出的教育产品榜单第二期(对应 2025 年 1 月 AI 教育 web 和 App 数据)。
Manus 爆火出圈,引发 Agent 热潮!从自行理解任务、拆解步骤到选择工具并执行,这需要 Agent 具备强大的复杂工作流编排和任务处理能力,而工作流也是智能体的核心技术之一。
大模型训练几乎消耗尽所有IT数据之后,挖掘OT数据正成为AI落地的重要方向。
“想把AI发展的这条路修好,数字基础设施是先行。”
大语言模型长序列文本生成效率新突破——生成10万Token的文本,传统自回归模型需要近5个小时,现在仅需90分钟!
只要微调模型生成的前8-32个词,就能让大模型推理能力达到和传统监督训练一样的水平?
现如今机器人又是跑步又是后空翻,但到底什么时候能做上家务给人类养养老?
HuggingFace热门榜单几乎被中国模型“承包”了!