AI资讯新闻榜单内容搜索-模型

2025年了，AI还看不懂时钟！90%人都能答对，顶尖AI全军覆没

一般人准确率89.1%，AI最好只有13.3%。在新视觉基准ClockBench上，读模拟时钟这道「小学题」，把11个大模型难住了。为什么AI还是读不准表？是测试有问题还是AI真不行？

来自主题: AI资讯

7975 点击 2025-09-09 17:24

再也不怕面瘫脸！YouTube黑科技：AI帮你「永久微笑」，连僵尸都咧嘴笑

几十G的大模型，怎么可能塞进一台手机？YouTube却做到了：在 Shorts 相机里，AI能实时「重绘」你的脸，让你一秒变身僵尸、卡通人物，甚至瞬间拥有水光肌，效果自然到分不清真假。

来自主题: AI资讯

7697 点击 2025-09-09 17:18

Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室的首篇论文，来了—— 提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。

来自主题: AI技术研报

9270 点击 2025-09-09 13:09

OpenAI新幻觉论文惹争议！GPT-5拉胯是测试基准有问题？？

OpenAI好不容易发了篇新论文，还是给GPT-5挽尊？

来自主题: AI资讯

9619 点击 2025-09-09 12:52

3.5亿参数模型媲美ChatGPT-4o？Liquid AI发布的日英翻译模型给出答案

在大模型的竞赛中，参数规模往往被视为性能的决定性因素。但近期，Liquid AI 的研究团队提出了一个不同寻常的案例：一个仅有 3.5 亿参数的模型，经过微调后，竟能在中短上下文的实时日语英语翻译任务上，与 GPT-4o 竞争。

来自主题: AI资讯

7577 点击 2025-09-09 12:19

英伟达推出通用深度研究系统，可接入任何LLM，支持个人定制

英伟达也做深度研究智能体了。

来自主题: AI资讯

8573 点击 2025-09-09 11:58

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

9701 点击 2025-09-09 10:49