AI资讯新闻榜单内容搜索-模型

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

大模型有苦恼，记性太好，无法忘记旧记忆，也区分不出新记忆！基于工作记忆的认知测试显示，LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中，模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报

7465 点击 2025-07-21 10:27

OpenAI最新模型曝光了，在2025年国际数学奥林匹克竞赛（IMO）上达到了金牌水平！IMO被公认为全球最顶尖的数学竞赛，每年只有不到8%的参赛者能够获得金牌。而现在，一个AI模型做到了。

来自主题: AI资讯

9737 点击 2025-07-20 23:48

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

9908 点击 2025-07-20 23:43

理想汽车车载大模型荣获由CCIA汽车网络安全工作委员会颁发的《生成内容安全测评证书》，及人工智能生成合成内容标识服务平台颁发的《生成合成内容标识报告》，成为国内首批通过GB/T 45654、GB 45438-2025双国标认证的车企

来自主题: AI资讯

9966 点击 2025-07-20 23:02

OpenAI的神秘模型o3-alpha意外曝光，其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军，最终不敌人类选手Psyho。

来自主题: AI资讯

8473 点击 2025-07-20 13:17

MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会，邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾，就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。

来自主题: AI资讯

8838 点击 2025-07-20 12:37

随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透，AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练（Post-training），正从过去锦上添花的“调优”环节，演变为决定模型最终价值的“主战场”。

来自主题: AI技术研报

8627 点击 2025-07-20 12:30

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。

来自主题: AI技术研报

7722 点击 2025-07-20 11:50

程序员最有价值的技能已经不再是编写代码了，而是精确地向 AI 传达意图。一份完善的规范才是包含完整意图的真正「源代码」。

来自主题: AI资讯

7676 点击 2025-07-20 11:44

只需一段视频，就可以直接生成可用的4D网格动画？！来自KAUST的研究团队提出全新方法V2M4，能够实现从单目视频直接生成高质量、显式的4D网格动画资源。

来自主题: AI技术研报

6765 点击 2025-07-20 11:21