AI资讯新闻榜单内容搜索-模型

深度讨论新一轮模型发布：当智能进入月更时代 | Best Ideas

当 AI 开始加速 AI，模型公司的迭代周期正在被进一步压缩，模型公司开始进入“月更时代”。

来自主题: AI资讯

8513 点击 2026-05-12 08:52

快手计划分拆旗下视频生成大模型业务可灵 AI，以 200 亿美元估值融资——截至今天港股收盘，整个快手公司目前的市值不到 290 亿美元。可灵当前的年化收入（ARR）已经达到 5 亿美元，已比春节前翻倍。

来自主题: AI资讯

10285 点击 2026-05-11 23:15

2026 年，机器人正在准备走进家庭，和人类同处一个屋檐下。

来自主题: AI资讯

6225 点击 2026-05-11 16:49

如果你让大模型给林黛玉找一个外国文学里的平替，它能给出令人信服的答案吗？这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

来自主题: AI技术研报

9054 点击 2026-05-11 16:47

机器人拉个拉链，到底需不需要“脑子”？

来自主题: AI技术研报

7821 点击 2026-05-11 16:10

这是一个“等待被大厂吞没”的行业，还是可能长出像Adobe那样的工具型公司？

来自主题: AI资讯

7717 点击 2026-05-11 16:09

近年来，大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架，Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报

6107 点击 2026-05-11 16:09

Claw-Eval-Live提出「活的」benchmark概念，通过信号采集与任务筛选，确保评测内容紧跟企业实际痛点，而非固定不变的题库。评测不仅关注结果，还追踪执行过程，从数据调用到状态变更，全面验证Agent的真实能力。

来自主题: AI技术研报

6470 点击 2026-05-11 16:08

当多模态大语言模型（MLLMs）在面对科学、技术、工程和数学（STEM）领域的视觉推理题时频频「翻车」，一个根本性的问题摆在了所有研究者面前：大模型做不出理科题，究竟是因为「脑子笨」（推理能力受限），还是因为「眼神差」（视觉感知缺陷）？

来自主题: AI技术研报

6918 点击 2026-05-11 16:08

他人生最大的一次跨步是博士毕业，毅然决然离开深造9年的物理，来到崭新的AI行业。过去两年，他先后在Anthropic和Google DeepMind出任研究科学家，参与了Claude 3.7、4.5、Gemini 3等关键模型的开发过程。

来自主题: AI资讯

12007 点击 2026-05-11 12:03