AI资讯新闻榜单内容搜索-语言模型

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

8122 点击 2025-05-15 17:12

ICML 2025 | 如何在合成文本数据时避免模型崩溃？

随着生成式人工智能技术的飞速发展，合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。

来自主题: AI技术研报

7813 点击 2025-05-14 14:04

ICML 2025 | 长视频理解新SOTA！蚂蚁&人大开源ViLAMP-7B，单卡可处理3小时视频

在视觉语言模型（Vision-Language Models，VLMs）取得突破性进展的当下，长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例，仅需数分钟即可产生逾百万的视觉 token，这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报

5475 点击 2025-05-13 08:54

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。

来自主题: AI技术研报

7708 点击 2025-05-12 14:51

斯坦福的以弱驭强W4S，用Meta-Agent驾驭更强的LLM，准确率提升至95.4% | 最新

本文详细介绍了斯坦福大学最新提出的"以弱驭强"（W4S）范式，这一创新方法通过训练轻量级的弱模型来优化强大语言模型的工作流。核心亮点包括：

来自主题: AI技术研报

8369 点击 2025-05-12 10:10

独立游戏小团队也能在GDC开讲座？｜AI原生游戏《1001夜》在旧金山的1周收获

一个月前，在旧金山全球游戏开发者大会上，AI原生独立游戏《1001夜》的制作人担任GDC Al Summit的演讲者，分享游戏中大语言模型驱动的核心玩法设计，与世界各地的游戏开发者进行了深入的交流。

来自主题: AI资讯

8387 点击 2025-05-11 14:27

突破多模态奖励瓶颈！中科院清华快手联合提出R1-Reward，用强化学习赋予模型长期推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用：

来自主题: AI技术研报

8474 点击 2025-05-09 11:51

ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码，多项任务远超RoPE

长文本能力对语言模型（LM，Language Model）尤为重要，试想，如果 LM 可以处理无限长度的输入文本，我们可以预先把所有参考资料都喂给 LM，或许 LM 在应对人类的提问时就会变得无所不能。

来自主题: AI技术研报

8363 点击 2025-05-09 10:42

尤雨溪宣布：Vue 生态正式引入 AI！

在前端开发领域，Vue 框架一直以其易用性和灵活性受到广大开发者的喜爱。而如今，Vue 生态在人工智能（AI）领域的应用上又迈出了重要的一步。尤雨溪近日宣布，Vue、Vite 和 Rolldown 的文档网站均已添加了llms.txt文件，这一举措旨在让大型语言模型（LLM）更方便地理解这些前端技术。

来自主题: AI资讯

8851 点击 2025-05-08 09:38

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

8773 点击 2025-05-06 15:07