AI资讯新闻榜单内容搜索-模型

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

9619 点击 2025-11-28 10:05

专访Luma AI首席科学家：视频生成模型的游戏规则改变了

To C玩梗是Sora的热闹，用多模态大一统模型服务专业客户，才是AI视频生成的正经生意。

来自主题: AI资讯

6644 点击 2025-11-28 10:03

大模型首次拥有“脖子”！纽大团队实现360度类人视觉搜索

终于有人要给大模型安“脖子”了！

来自主题: AI技术研报

7853 点击 2025-11-28 10:03

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究

基准测试（Benchmarks）在人工智能的发展进程中扮演着至关重要的角色，构成了评价生成式模型（Generative Models）性能的事实标准。对于从事模型训练与评估的AI研究者而言，GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。

来自主题: AI技术研报

9382 点击 2025-11-28 09:28

深度讨论 Gemini 3 ：Google 王者回归，LLM 新一轮排位赛猜想｜Best Ideas

最近两周的模型竞赛非常热闹：OpenAI 在 11 月 12 日发布 GPT-5.1，引入更强的推理深度与更高效的对话体验；Google 在 11 月 18 日发布 Gemini 3，全面强化多模态理解与复杂推理能力；Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5，模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。

来自主题: AI资讯

9063 点击 2025-11-28 09:27

NeuroAI的尴尬现实：我们是被迫加上AI这个标签的吗？

“后来，人工智能（AI）变得无处不在。如今我们‘勉强’接受NeuroAI这个称呼，只为大众能理解其含义。”

来自主题: AI资讯

7526 点击 2025-11-28 09:25

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

被顶会ICCV 2025以554高分接收的视频理解框架来了！

来自主题: AI技术研报

8236 点击 2025-11-28 09:24

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

9576 点击 2025-11-27 22:47

AI帮人类发现长寿药！95后科学家开发抗衰大模型，揭示数千种可逆转生物年龄的干预措施

近期，一支来自美国哈佛大学和美国斯坦福大学等联合团队真的做到了——他们集成 40 余种衰老时钟模型开发了一个名为 ClockBase Agent 的平台，让 AI 在 200 万份人类和小鼠的分子组学数据里“挖宝”，并找出了超过 500 种可能让生物年龄倒退的干预措施。

来自主题: AI资讯

8584 点击 2025-11-27 17:28

月之暗面公开强化学习训练加速方法：训练速度暴涨97%，长尾延迟狂降93%

u1s1，现在模型能力是Plus了，但Rollout阶段的速度却越来越慢……

来自主题: AI技术研报

8872 点击 2025-11-27 15:29

AI资讯新闻榜单内容搜索-模型

RAG效果要提升，先搞定高质量Context Pruning

专访Luma AI首席科学家：视频生成模型的游戏规则改变了

大模型首次拥有“脖子”！纽大团队实现360度类人视觉搜索

AI基准测试集体塌房，最高84%都是坏题 ｜斯坦福最新研究

深度讨论 Gemini 3 ：Google 王者回归，LLM 新一轮排位赛猜想｜Best Ideas

NeuroAI的尴尬现实：我们是被迫加上AI这个标签的吗？

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

DeepSeek强势回归，开源IMO金牌级数学模型

AI帮人类发现长寿药！95后科学家开发抗衰大模型，揭示数千种可逆转生物年龄的干预措施

月之暗面公开强化学习训练加速方法：训练速度暴涨97%，长尾延迟狂降93%

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究