AI资讯新闻榜单内容搜索-模型

LeCun新证明：世界是高斯的

LeCun的LeJEPA到底有没有构建出世界模型？他本人最新发表的论文，解答了这个问题。

来自主题: AI技术研报

8348 点击 2026-05-29 09:37

刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！

2026 年初，国内具身智能赛道掀起了一波开源潮，越来越多团队开始公开自己的视觉-语言-动作（VLA）模型、数据集与训练框架。与此同时，行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上，尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报

8313 点击 2026-05-29 09:19

大模型也需要睡觉！让AI打个盹，醒来更聪明

7×24，AI也吃不消。

来自主题: AI技术研报

7694 点击 2026-05-29 09:19

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

6669 点击 2026-05-29 09:19

刚刚，DeepSeek陈德里与两个AI，合写了一篇论文

「借助 CodeAgent，我终于可以重新捡起很多过去因为精力不足而搁置的事情了，写博客就是其中之一。这篇博客大概 1% 是我写的，99% 是 Agent 写的 😂」。

来自主题: AI技术研报

6913 点击 2026-05-29 09:19

重塑人机对话理解范式，Google新数据集首次大规模捕捉用户「未言明的想法」

当对话型 AI 服务于数十亿用户时，我们能否看见用户没说出口的那一层？JHU、MIT 和 Google Research 给出了新的解法。

来自主题: AI技术研报

8775 点击 2026-05-29 09:18

Gamma 联合创始人：你以为只有应届生在怕 AI？大模型公司也一样

有一个我们很少说出口的预设：AI 带来的恐慌是从下往上递减的。越底层越慌，越顶层越从容。应届生最危险，大厂高管有把握，基础模型公司的人？他们是在写未来，不是在应对它。

来自主题: AI资讯

7955 点击 2026-05-29 09:18

首次！DeepSeek-V4-Pro全参数后训练，被第三方在国产卡上跑通

近期，深圳河套学院（SLAI）AI训练平台项目团队，联合哈尔滨工业大学（深圳）、深圳大数据研究院、华为GTS（全球技术服务）团队与深智城AI算力平台，仅用1个月，共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行，完成长稳训练1500+步，训练MFU超30%，关键训练算子效率提升14%。

来自主题: AI技术研报

9246 点击 2026-05-28 14:56

7B打败o3、GPT-5！医学AI智能体让模型学会“看哪里、怎么看”

医学AI会写解释，但不代表它真的“看到”了关键证据。

来自主题: AI技术研报

10268 点击 2026-05-28 14:51

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7141 点击 2026-05-28 14:51