AI资讯新闻榜单内容搜索-RL

AI虚拟细胞面世，无需等待实验，可预警药物疗效与机制

有了 AI，科学研究是否有一天可以摆脱对湿实验的高度依赖，通过在计算机中构建“虚拟细胞”，来模拟和理解新药可能产生的生物效应？如今，这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 V

来自主题: AI资讯

8738 点击 2026-01-11 10:10

一年后，DeepSeek-R1的每token成本降到了原来的1/32

几天前，DeepSeek 毫无预兆地更新了 R1 论文，将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容，包括首次公开训练全路径，即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline，以及「Aha Moment」的数据化验证等等。

来自主题: AI技术研报

8667 点击 2026-01-10 17:02

1人顶1个Infra团队！OpenAI前CTO新招，让大模型训练跌成白菜价

当大模型竞争转向后训练，继续为闲置显卡烧钱无异于「慢性自杀」。如今，按Token计费的Serverless模式，彻底终结了算力租赁的暴利时代，让算法工程师真正拥有了定义物理世界的权利。

来自主题: AI技术研报

8345 点击 2026-01-07 18:35

OpenAI前CTO首个创业产品Tinker，这里全量升级开放了，还有羊毛可薅

当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward，optimizer step 等⼀系列基本原语，分离了算法设计等部分与分布式训练基础设施关联，

来自主题: AI技术研报

9191 点击 2026-01-07 15:30

Z Waves丨从洗衣店女孩到“AI教母”，50岁的李飞飞再造AI新范式，用World Labs开启空间智能革命

她是当代人工智能界最具象征意义的女性科学家之一。提到人工智能领域，李飞飞（Fei-Fei Li）无疑是最醒目的那一个。1976年出生的她，早年在美求学，1999年以物理学荣誉学士毕业于普林斯顿大学，随后在加州理工学院获得电气工程博士学位。

来自主题: AI资讯

10930 点击 2026-01-06 17:18

MIT团队推出递归语言模型！不改架构、不扩窗口，上下文处理能力扩展百倍

新年伊始，MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L． Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language Models》的论文，提出了所谓“递归语言模型”（Recursive Language Models，简称 RLM）的推理策略。

来自主题: AI技术研报

7449 点击 2026-01-04 14:51