AI技术研报-这里有最前沿的人工智能技术解读

大模型智能体如何突破规模化应用瓶颈，核心在于Agentic ROI

上海交通大学联合中科大在本文中指出：现阶段大模型智能体的主要障碍不在于模型能力不足，而在于其「Agentic ROI」尚未达到实用化门槛。研究团队提出 Agentic ROI（Agentic Return on Investment）这一核心指标，用于衡量一个大模型智能体在真实使用场景中所带来的「信息收益」与其「使用成本」之间的比值：

来自主题: AI技术研报

8321 点击 2025-05-30 15:06

中国团队让AI拥有「视觉想象力」，像人类一样脑补画面来思考

在人类的认知过程中，视觉思维（Visual Thinking）扮演着不可替代的核心角色，这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报

10191 点击 2025-05-30 12:53

妈妈再也不用担心延迟了！斯坦福手搓Llama超级内核，推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」，将Llama-1B模型前向传播完整融合进单一GPU内核，实现推理时间低于1毫秒。在B200上每次推理仅需680微秒，比vLLM快3.5倍。

来自主题: AI技术研报

9393 点击 2025-05-30 12:36

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

近日，NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM，以无需训练的即插即用加速方案，实现了推理速度的突破！通过创新的技术组合，在不依赖重新训练模型的前提下，该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据，解析其核心优势。

来自主题: AI技术研报

9217 点击 2025-05-30 12:08

自进化零监督多Agent框架： MAS-ZERO，让AI因地制宜动态适应

主席在《矛盾论》中强调"具体问题具体分析，是Marxism的活的灵魂"。而在AI领域，我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO，帮我们构建能够因地制宜、因时制宜的智能系统。

来自主题: AI技术研报

7528 点击 2025-05-30 12:03

Linear-MoE：线性注意力遇上混合专家的开源实践

来自上海人工智能实验室团队的最新成果 Linear-MoE，首次系统性地实现了线性序列建模与 MoE 的高效结合，并开源了完整的技术框架，包括 Modeling 和 Training 两大部分，并支持层间混合架构。为下一代基础模型架构的研发提供了有价值的工具和经验。

来自主题: AI技术研报

8988 点击 2025-05-30 12:03

刚刚，AI科学家Zochi在ACL「博士毕业」，Beta测试今日上线

又有一个 AI Scientist 的论文通过了顶会同行评审。

来自主题: AI技术研报

10855 点击 2025-05-29 18:38

LLM省钱大测评！48块GH200，首个百亿级参数量实证

EfficientLLM项目聚焦LLM效率，提出三轴分类法和六大指标，实验包揽全架构、多模态、微调技术，可为研究人员提供效率与性能平衡的参考。

来自主题: AI技术研报

8522 点击 2025-05-29 17:16

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告，进一步披露了这个模型的细节。

来自主题: AI技术研报

9627 点击 2025-05-29 16:47

RSS 2025｜从说明书学习复杂机器人操作任务：NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

视觉语言模型（Vision-Language Models, VLMs），为真实环境中的机器人操作任务提供了极具潜力的解决方案。

来自主题: AI技术研报

9861 点击 2025-05-29 16:33

搜索Agent最新高效推理框架：吞吐量翻3倍、延迟降至1/5，还不牺牲答案质量丨南开& UIUC研究

AI越来越聪明，但如果它们反应慢，效率低，也难以满足我们的需求。

来自主题: AI技术研报

7011 点击 2025-05-29 15:19

市盈率超 500 倍，AI 巨头 Palantir 的璀璨与迷思

全球最贵估值科技公司，AI 巨头 Palantir 如何合理定价？

来自主题: AI技术研报

10543 点击 2025-05-29 15:18

基准测试揭秘大模型“字数危机”：26个模型长文本生成普遍拉胯，最大输出长度过度宣传

你是否曾对大语言模型（LLMs）下达过明确的“长度指令”？

来自主题: AI技术研报

9327 点击 2025-05-29 15:12

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。

来自主题: AI技术研报

9330 点击 2025-05-29 15:10

奖励是假的，能让Qwen提升25%性能却是真的！

即使RLVR（可验证奖励强化学习）使用错误的奖励信号，Qwen性能也能得到显著提升？

来自主题: AI技术研报

9224 点击 2025-05-29 15:01

SOTA大模型遇上加密数据评测：Qwen3未破10%，o1也栽了丨上海AI Lab等联合研究

大语言模型遇上加密数据，即使是最新Qwen3也直冒冷汗！

来自主题: AI技术研报

8274 点击 2025-05-29 14:59

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要，近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力，但现有方法在训练过程中面临两大核心挑战：

来自主题: AI技术研报

6174 点击 2025-05-29 14:48

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作，首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT（Joint Diffusion Transformer）框架实现了图像 → 动态视频 + 声音的高质量联合生成。

来自主题: AI技术研报

9209 点击 2025-05-29 14:20