AI资讯新闻榜单内容搜索-模型

笑死！xAI员工竟用Claude写代码？这回Anthropic反手拔了马斯克的网线

一封内部信揭开了AI巨头们之间最尴尬的秘密。根据内部Slack泄露的消息，xAI联合创始人Tony Wu向全体员工发布了一则紧急通知：各位同事，相信很多人已经发现，Cursor中的Claude（Anthropic）模型已无法响应。据Cursor反馈，这是Anthropic针对所有主要竞争对手实施的新政策。

来自主题: AI资讯

8704 点击 2026-01-11 10:11

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

刚刚，GPT-5.2刷新了一项新纪录！OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上，表现超过了人类基线水平。

来自主题: AI资讯

9402 点击 2026-01-11 10:10

30人团队震撼英伟达！Jim Fan自曝三个教训，重押世界模型

英文达杰出科学家Jim Fan表示，我正全身心投入一个单一使命：为机器人解决「Physical Turing Test」（物理图灵测试）。这是AI的下一个挑战，甚至可能是「终极挑战」。

来自主题: AI资讯

7487 点击 2026-01-11 10:09

DeepSeek-OCR是「长文本理解」未来方向？中科院新基准VTCBench给出答案

近期，DeepSeek-OCR 凭借其创新的「视觉文本压缩」（Vision-Text Compression, VTC）范式引发了技术圈的高度关注。为了解答这一疑问，来自中科院自动化所、中国科学院香港创新研究院等机构的研究团队推出了首个专门针对视觉 - 文本压缩范式的基准测试 ——VTCBench。

来自主题: AI技术研报

6843 点击 2026-01-11 10:01

智能体「卷王」诞生！干活自动配结项报告，1.5张截图就把事说清了

SmartSnap的核心思想是将GUI智能体从“被动的执行者”转变为“主动的自证者”。简单来说，智能体在完成任务的同时，还会主动收集、筛选并提交一份“证据快照集”。

来自主题: AI技术研报

8193 点击 2026-01-11 10:01

打破学科壁垒！400篇参考文献重磅综述，统一调查「人脑×Agent」记忆系统

哈工大、鹏城实验室、新加坡国立、复旦、北大联合发布了一篇重磅综述《AI Meets Brain: A Unified Survey on Memory System from Cognitive Neuroscience to Autonomous Agents》，首次打破认知神经科学与人工智能之间的学科壁垒，系统性地将人脑记忆机制与 Agents 记忆统一审视，

来自主题: AI技术研报

8642 点击 2026-01-11 10:00

5亿美元融资之后，杨植麟首次深度分享Kimi的技术重点（含演讲全文）

1月10日，很久没有公开露面的月之暗面创始人杨植麟，在一场定向邀请的行业论坛中，详细地分享了2025年Kimi的技术路线重点，以及对未来的思考。这次分享，有一个核心关键词，Agentic智能时代。这是通用大模型竞争的一个未来高地

来自主题: AI资讯

8000 点击 2026-01-11 09:51

让两个大模型「在线吵架」，他们跑通了全网95%科研代码｜深势发布Deploy-Master

在真实世界中，部署并不是一个孤立步骤，而是一条连续链路：工具能否被发现、是否被正确理解、能否构建环境，以及是否真的可以被执行。Deploy-Master 正是围绕这条链路，被设计为一个以执行为中心的一站式自动化工作流。

来自主题: AI资讯

7887 点击 2026-01-10 17:04

蚂蚁再把医疗AI卷出新高度！蚂蚁·安诊儿医疗大模型开源即SOTA

就在医疗AI赛道激战正酣时，一个搅局者低调入场了。它就是蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源的医疗大模型——蚂蚁·安诊⼉（AntAngelMed）。

来自主题: AI资讯

7823 点击 2026-01-10 17:03

一年后，DeepSeek-R1的每token成本降到了原来的1/32

几天前，DeepSeek 毫无预兆地更新了 R1 论文，将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容，包括首次公开训练全路径，即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline，以及「Aha Moment」的数据化验证等等。

来自主题: AI技术研报

7196 点击 2026-01-10 17:02