AI资讯新闻榜单内容搜索-不

准确率腰斩！大模型视觉能力一出日常生活就「失灵」

我们习惯了AI在屏幕上侃侃而谈、生成美图，好像它无所不知。但假如把它“扔”进一个真实的手术室，让它用主刀医生的第一视角来判断下一步该用哪把钳子，这位“学霸”很可能当场懵圈。

来自主题: AI技术研报

9735 点击 2025-12-09 10:37

100 万亿 Token 揭秘全球用户怎么用 AI：一半算力用在「不可描述」的地方

AI 领域迄今最大规模的用户行为实录，刚刚发布了。这是全球模型聚合平台 OpenRouter 联合硅谷顶级风投 a16z 发布的一份报告，基于全球 100 万亿次真实 API 调用、覆盖 300+款 AI 模型、60+家供应商、超过 50% 非美国用户。

来自主题: AI技术研报

9939 点击 2025-12-08 22:18

又一国产图像大模型开源！实测连续P图绝了，中文渲染是短板

今日，美团正式发布并开源图像生成模型LongCat-Image，这是一款在图像编辑能力上达到开源SOTA水准的6B参数模型，重点瞄准文生图与单图编辑两大核心场景。在实际体验中，它在连续改图、风格变化和材质细节上表现较好，但在复杂排版场景下，中文文字渲染仍存在不稳定的情况。

来自主题: AI资讯

8704 点击 2025-12-08 19:51

自费购买，把豆包AI手机当主力机3天，我的真实体验有些不同

上周，“豆包手机助手”一跃成为AI圈与手机圈的年度热点，热度与争议齐飞。我们抢在首批样机售罄前，自费3499元入手了一台搭载豆包手机助手的努比亚M153工程机，进行了3天的沉浸式体验，对这其中的争议和真实使用体验有了更深的感受。

来自主题: AI产品测评

10868 点击 2025-12-08 15:47

只要交钱，高中生也能发NeurIPS？港大教授怒批顶会变味

在AI的浪潮下，学术研究正在被商业机构加速「量产化」，包装成明码标价的「入学筹码」。这不仅稀释了学术研究的含金量，挤占了学术资源，也可能导致学术通胀、学历贬值与更深层的信任危机。

来自主题: AI资讯

7210 点击 2025-12-08 15:14

谷歌秀肌肉了：披露Gemini 3.0为啥过目不忘越用越好用，Titans的惊喜度+Miras框架

最近，Google Research 发布了一篇 Blog《Titans + MIRAS：帮助人工智能拥有长期记忆》。它们允许 AI 模型在运行过程中更新其核心内存，从而更快地工作并处理海量上下文。

来自主题: AI技术研报

10751 点击 2025-12-08 14:41

DeepSeek V3到V3.2的进化之路，一文看全

12 月 1 日，DeepSeek 一口气发布了两款新模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去，热度依旧不减，解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读，其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报

9613 点击 2025-12-08 12:48