AI资讯新闻榜单内容搜索-模型

强化学习+大模型记忆：Mem-α，让智能体第一次学会“如何记忆”

Mem-α 的出现，正是为了解决这一困境。由加州大学圣地亚哥分校的 Yu Wang 在 Anuttacon 实习期间完成，这项工作是首次将强化学习引入大模型的记忆管理体系，让模型能够自主学习如何使用工具去存储、更新和组织记忆。

来自主题: AI技术研报

9244 点击 2025-11-08 10:33

大模型比拼：MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5

正好上周（10月27日），MiniMax 公司发布了[2] M2 模型，代表了国产大模型的最新水平。我就想，可以测测它的实战效果，跟智谱公司的 GLM 4.6 和 Anthropic 公司的 Claude Sonnet 4.5 对比一下。毕竟它们都属于目前最先进的编程大模型，跟我们开发者切身相关。

来自主题: AI产品测评

9854 点击 2025-11-07 15:32

两周复刻DeepSeek-OCR！两人小团队还原低token高压缩核心，换完解码器更实用

两人小团队，仅用两周就复刻了之前被硅谷夸疯的DeepSeek-OCR？？复刻版名叫DeepOCR，还原了原版低token高压缩的核心优势，还在关键任务上追上了原版的表现。完全开源，而且无需依赖大规模的算力集群，在两张H200上就能完成训练。

来自主题: AI资讯

9112 点击 2025-11-07 15:22

对话杨红霞：从大厂到创业，她希望做出下一个OpenAI

杨红霞，是中国大模型领域一个无法绕开的名字。人们从 M6 模型（阿里达摩院发布的万亿参数 AI 大模型）开始熟知她，而她又在最近走出创业隐匿模式，正式向世界宣告自己已经是一名创业者，并希望能够做出下一

来自主题: AI资讯

9540 点击 2025-11-07 15:05

自回归科学基座模型 BigBang-Proton，提出实现 AGI 的新路线

近日，专注于研发物质世界基座模型的公司超越对称（上海）技术有限公司（超对称）发布了新版基座模型 BigBang-Proton，成功实现多个真实世界的专业学科问题与 LLM 的统一预训练和推理，挑战了 Sam Altman 和主流的 AGI 技术路线。

来自主题: AI技术研报

9410 点击 2025-11-07 15:03

在失败中进化？UIUC联合斯坦福、AMD实现智能体「从错误中成长」

伊利诺伊大学厄巴纳 - 香槟分校（UIUC）等团队近日发布论文，系统性剖析了 LLM 智能体失败的机制，并提出了可自我修复的创新框架 ——AgentDebug。该研究认为，AI 智能体应成为自身的观察者和调试者，不仅仅是被动的任务执行者，为未来大规模智能体的可靠运行和自动进化提供了理论与实践工具。

来自主题: AI技术研报

8111 点击 2025-11-07 15:01

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤：推测解码加速器AdaSPEC来了

目前，最先进的对齐方法是使用知识蒸馏（Knowledge Distillation, KD）在所有 token 上最小化 KL 散度。然而，最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限，草稿模型往往难以完整吸收目标模型的知识，导致直接使用蒸馏方法的性能提升受限。在极限场景下，草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报

8973 点击 2025-11-07 14:57