AI资讯新闻榜单内容搜索-

多步推理碾压GPT-4o，无需训练性能提升10%！斯坦福开源通用框架OctoTools

OctoTools通过标准化工具卡和规划器，帮助LLMs高效完成复杂任务，无需额外训练。在16个任务中表现优异，比其他方法平均准确率高出9.3%，尤其在多步推理和工具使用方面优势明显。

来自主题: AI技术研报

7757 点击 2025-03-12 14:47

为了解决视频编辑模型缺乏训练数据的问题，本文作者（来自香港中文大学、香港理工大学、清华大学等高校和云天励飞）提出了一个名为 Señorita-2M 的数据集。该数据集包含 200 万高质量的视频编辑对，囊括了 18 种视频编辑任务。

来自主题: AI技术研报

8652 点击 2025-03-12 14:41

本文是白鲸出海与联合非凡产研推出的教育产品榜单第二期（对应 2025 年 1 月 AI 教育 web 和 App 数据）。

来自主题: AI资讯

9291 点击 2025-03-12 14:36

Manus 爆火出圈，引发 Agent 热潮！从自行理解任务、拆解步骤到选择工具并执行，这需要 Agent 具备强大的复杂工作流编排和任务处理能力，而工作流也是智能体的核心技术之一。

来自主题: AI技术研报

10504 点击 2025-03-12 14:18

大模型训练几乎消耗尽所有IT数据之后，挖掘OT数据正成为AI落地的重要方向。

来自主题: AI资讯

9740 点击 2025-03-12 14:09

“想把AI发展的这条路修好，数字基础设施是先行。”

来自主题: AI资讯

7697 点击 2025-03-12 14:01

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10112 点击 2025-03-12 13:52

只要微调模型生成的前8-32个词，就能让大模型推理能力达到和传统监督训练一样的水平？

来自主题: AI技术研报

8443 点击 2025-03-12 13:41

现如今机器人又是跑步又是后空翻，但到底什么时候能做上家务给人类养养老？

来自主题: AI技术研报

10057 点击 2025-03-12 13:23

HuggingFace热门榜单几乎被中国模型“承包”了！

来自主题: AI资讯

9309 点击 2025-03-12 10:27