AI资讯新闻榜单内容搜索-语言模型

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

作为首批入选印度“IndiaAI Mission”国家级项目、承担构建印度主权基础大模型任务的公司之一，Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。

来自主题: AI资讯

11975 点击 2025-05-27 14:44

与Gemini Diffusion共振！首个扩散式「发散思维链」来了

近年来，思维链在大模型训练和推理中愈发重要。近日，西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤，然后利用基于结果的强化学习去优化整个生成轨迹，最大化模型最终答案的正确率。

来自主题: AI技术研报

8495 点击 2025-05-27 13:21

19岁少年「破解」谷歌新AI？每秒1479 token，扩散再战GPT!

年仅19岁少年，自称破解了谷歌最快的语言模型Gemini Diffusion，引爆社交平台。真相扑朔迷离，但有一点毫无疑问：谷歌I/O大会的「黑马」，比GPT快10倍的速度、媲美人类程序员的代码能力，正在掀起一场NLP范式大洗牌。

来自主题: AI资讯

9780 点击 2025-05-24 19:28

比Gemini Diffusion更全能！首个多模态扩散大语言模型MMaDA发布，同时实现强推理与高可控性

普林斯顿大学与字节 Seed、北大、清华等研究团队合作提出了 MMaDA（Multimodal Large Diffusion Language Models），作为首个系统性探索扩散架构的多模态基础模型，MMaDA 通过三项核心技术突破，成功实现了文本推理、多模态理解与图像生成的统一建模。

来自主题: AI技术研报

10478 点击 2025-05-22 17:30

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

谷歌又放新大招了，将图像生成常用的“扩散技术”引入语言模型，12秒能生成1万tokens。

来自主题: AI资讯

8931 点击 2025-05-22 10:23

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

大语言模型（LLM）的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容，而新兴的异步生成范式通过识别语义独立的内容块，实现并行生成。

来自主题: AI技术研报

8411 点击 2025-05-21 14:12

苹果准备放出AI底牌：向开发者开放大模型权限

知名科技记者马克·古尔曼（Mark Gurman）撰文表示，苹果公司正准备允许第三方开发者使用其人工智能模型编写软件，旨在推动新应用的开发，并提升其设备的吸引力。知情人士透露，苹果正在开发一套软件开发工具包（SDK）及相关框架，以便外部开发者能够基于苹果的大语言模型构建AI功能。这一计划预计将在6月9日的全球开发者大会（WWDC）上公布。

来自主题: AI资讯

9601 点击 2025-05-21 09:58

不用等了！吴恩达MCP课程来了！

MCP 是一种开放的技术协议，旨在标准化大型语言模型（LLM）与外部工具和服务的交互方式。你可以把 MCP 理解成像是一个 AI 世界的通用翻译官，让 AI 模型能够与各种各样的外部工具"对话"。

来自主题: AI资讯

8721 点击 2025-05-20 09:44

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

理想中的多模态大模型应该是什么样？十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集，用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足，且多数通用模型未能超越专家模型，真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报

10965 点击 2025-05-19 17:08

换模型就得重新优化提示词？用下MetaSPO，专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词？资源浪费且效率低下！本文介绍MetaSPO框架，首个专注模型迁移系统提示优化的元学习方法，让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果：框架自动生成了五种不同教育范式的系统提示，最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型，评分从0.3920提升至0.4362。

来自主题: AI技术研报

8916 点击 2025-05-19 10:11