AI资讯新闻榜单内容搜索-模型

vivo AI Lab提出自我进化的移动GUI智能体，UI-Genie无需人工标注实现性能持续提升

本文来自于香港中文大学 MMLab 和 vivo AI Lab，其中论文第一作者肖涵，主要研究方向为多模态大模型和智能体学习，合作作者王国志，研究方向为多模态大模型和 Agent 强化学习。项目 le

来自主题: AI技术研报

6987 点击 2025-11-08 11:00

强化学习+大模型记忆：Mem-α，让智能体第一次学会“如何记忆”

Mem-α 的出现，正是为了解决这一困境。由加州大学圣地亚哥分校的 Yu Wang 在 Anuttacon 实习期间完成，这项工作是首次将强化学习引入大模型的记忆管理体系，让模型能够自主学习如何使用工具去存储、更新和组织记忆。

来自主题: AI技术研报

8076 点击 2025-11-08 10:33

大模型比拼：MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5

正好上周（10月27日），MiniMax 公司发布了[2] M2 模型，代表了国产大模型的最新水平。我就想，可以测测它的实战效果，跟智谱公司的 GLM 4.6 和 Anthropic 公司的 Claude Sonnet 4.5 对比一下。毕竟它们都属于目前最先进的编程大模型，跟我们开发者切身相关。

来自主题: AI产品测评

8111 点击 2025-11-07 15:32

两周复刻DeepSeek-OCR！两人小团队还原低token高压缩核心，换完解码器更实用

两人小团队，仅用两周就复刻了之前被硅谷夸疯的DeepSeek-OCR？？复刻版名叫DeepOCR，还原了原版低token高压缩的核心优势，还在关键任务上追上了原版的表现。完全开源，而且无需依赖大规模的算力集群，在两张H200上就能完成训练。

来自主题: AI资讯

8147 点击 2025-11-07 15:22

对话杨红霞：从大厂到创业，她希望做出下一个OpenAI

杨红霞，是中国大模型领域一个无法绕开的名字。人们从 M6 模型（阿里达摩院发布的万亿参数 AI 大模型）开始熟知她，而她又在最近走出创业隐匿模式，正式向世界宣告自己已经是一名创业者，并希望能够做出下一

来自主题: AI资讯

8622 点击 2025-11-07 15:05

自回归科学基座模型 BigBang-Proton，提出实现 AGI 的新路线

近日，专注于研发物质世界基座模型的公司超越对称（上海）技术有限公司（超对称）发布了新版基座模型 BigBang-Proton，成功实现多个真实世界的专业学科问题与 LLM 的统一预训练和推理，挑战了 Sam Altman 和主流的 AGI 技术路线。

来自主题: AI技术研报

8481 点击 2025-11-07 15:03

在失败中进化？UIUC联合斯坦福、AMD实现智能体「从错误中成长」

伊利诺伊大学厄巴纳 - 香槟分校（UIUC）等团队近日发布论文，系统性剖析了 LLM 智能体失败的机制，并提出了可自我修复的创新框架 ——AgentDebug。该研究认为，AI 智能体应成为自身的观察者和调试者，不仅仅是被动的任务执行者，为未来大规模智能体的可靠运行和自动进化提供了理论与实践工具。

来自主题: AI技术研报

7178 点击 2025-11-07 15:01

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤：推测解码加速器AdaSPEC来了

目前，最先进的对齐方法是使用知识蒸馏（Knowledge Distillation, KD）在所有 token 上最小化 KL 散度。然而，最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限，草稿模型往往难以完整吸收目标模型的知识，导致直接使用蒸馏方法的性能提升受限。在极限场景下，草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报

8034 点击 2025-11-07 14:57

北大团队让AI学会考古！全球首个古希腊陶罐3D视觉问答数据集发布，还配了专用模型

现在AI都懂文物懂历史了。一项来自北京大学的最新研究引发关注：他们推出了全球首个面向古希腊陶罐的3D视觉问答数据集——VaseVQA-3D，并配套推出了专用视觉语言模型VaseVLM。这意味着，AI正在从“识图机器”迈向“文化考古Agent”。

来自主题: AI技术研报

8012 点击 2025-11-07 14:49

刚刚，AI大牛刘威视频创业公司Video Rebirth，完成5000万美元融资

AI 视频初创公司 Video Rebirth 今日宣布完成 5000 万美元的融资。本轮融资参与方阵容强大，包括全球及新加坡的头部美元基金、互联网巨头、中国及韩国老牌游戏上市公司、全球领先的芯片企业及知名家族办公室，募集资金将主要用于视频模型的持续迭代、顶尖人才招募及全球市场拓展。

来自主题: AI资讯

8443 点击 2025-11-07 12:17