AI资讯新闻榜单内容搜索-模型训练

1人顶1个Infra团队！OpenAI前CTO新招，让大模型训练跌成白菜价

当大模型竞争转向后训练，继续为闲置显卡烧钱无异于「慢性自杀」。如今，按Token计费的Serverless模式，彻底终结了算力租赁的暴利时代，让算法工程师真正拥有了定义物理世界的权利。

来自主题: AI技术研报

7724 点击 2026-01-07 18:35

过去一段时间，我们介绍了很多小白入门级的agent框架，也介绍了包括langchain在内的很多专业级agent搭建框架。

来自主题: AI技术研报

8765 点击 2026-01-07 17:23

Transformer 已经改变了世界，但也并非完美，依然还是有竞争者，比如线性递归（Linear Recurrences）或状态空间模型（SSM）。这些新方法希望能够在保持模型质量的同时显著提升计算性能和效率。

来自主题: AI技术研报

9047 点击 2026-01-07 17:22

Andrej Karpathy 大神力荐的 Vibe Coding，正在成为开发者的新宠。这种「只需聊一聊，AI 可以把功能写出来」的体验，极大提升了简单任务的开放效率。

来自主题: AI技术研报

8171 点击 2026-01-07 16:03

这篇文章的思路来自 Philipp Schmid，由 minghao 推荐 https://www.philschmid.de/agent-harness-2026

来自主题: AI资讯

9422 点击 2026-01-07 16:01

当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward，optimizer step 等⼀系列基本原语，分离了算法设计等部分与分布式训练基础设施关联，

来自主题: AI技术研报

8425 点击 2026-01-07 15:30

2025 年，随着李飞飞等学者将 “空间智能”（Spatial Intelligence）推向聚光灯下，这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新 SOTA，似乎 AI 在训练中已经更好地读懂了三维空间。

来自主题: AI技术研报

8601 点击 2026-01-07 09:36

您可能已经感受到了，从2025年开始到如今，全世界都在谈论Agentic AI或Agent（代理式AI）。从董事会到咨询公司，从更高级别的战略到街头巷尾，仿佛只要接入了大模型（LLM），所有的业务流程就能自动运转，效率就能翻倍。

来自主题: AI技术研报

10681 点击 2026-01-06 16:18

BiCo是一种创新的AI视觉内容生成方法，能灵活组合图像和视频中的视觉概念，实现可控编辑。它通过分层绑定器、多样化与吸收机制、时间解耦策略等技术创新，解决了现有方法在概念提取和组合上的问题，让AI真正理解并融合视觉元素。

来自主题: AI技术研报

6183 点击 2026-01-06 16:16

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

7909 点击 2026-01-06 09:50