AI资讯新闻榜单内容搜索-Multi

ICML 2026 | 多智能体系统也能搭积木？Agent Primitives让MAS走向模块化复用

多智能体系统（Multi-Agent Systems，MAS）展示了令人印象深刻的能力：一个模型负责提出方案，另一个模型进行批评，还有模型承担投票、规划或执行。通过角色分工和多轮协作，系统能够解决单个模型难以稳定完成的数学推理、代码生成和知识问答任务。

来自主题: AI技术研报

7805 点击 2026-07-21 17:05

用AI读懂每只猫丨冬阳科技完成种子轮融资, AI 猫窝首秀 WAIC

出差第三天，晚上八点回到酒店，你拿出手机，贴一贴按自家猫 1:1 定制的玩偶，屏幕上弹出今日份“猫猫日报”：睡了 14 小时，呼吸平稳，深度睡眠占比 72%，体重较昨日增加 30g，一切安好。

来自主题: AI资讯

9638 点击 2026-07-19 21:47

DeepSeek之后，中国AI「自己出题」杀进Nature通讯！全球仅4家

2026年5月28日，Nature通讯发表了题为《Multimodal deep learning model for AI-based functional prognostic risk stratification in patients undergoing radical nephrectomy》的论文。

来自主题: AI技术研报

8511 点击 2026-07-08 15:57

AI生图免训练提速1000%，办法：最简洁的“三阶段流水线”

MrFlow（Multi-Resolution Flow Matching）就用这样的三阶段，在Qwen-Image等模型上把端到端生成时间从49.32s压到4.77s，实际加速10.35x。文章发布当日即登上Hugging Face Daily Papers；发布三天内，GitHub已收获200+stars；目前也已登上Hugging Face Trending Papers。

来自主题: AI技术研报

8631 点击 2026-07-08 15:02

ICML 2026｜如何对Multi-Agent系统进行过程评估？重新认识多智能体系统中的Orchestrator

来自南京大学 NLP 实验室的 ICML 2026 论文 Recognize Your Orchestrator: An Entropy Dynamics Perspective for LLM Multi-Agent Systems 指出：在当前主流的 Orchestrator-Executor 多智能体架构中，系统失败往往并不首先来自某个执行器不会干活，

来自主题: AI技术研报

8626 点击 2026-07-06 15:48

单个tokenizer胜任图像视频理解生成！南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列（HYDRA，HYDRA-X）工作挑战了这个惯例，用一个基于ViT的统一视觉Tokenizer，帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer，使其同时具有理解和生成的能力，进而同时作为理解和生成的Autoencoder，来支持原生多模态模型（Unified Multimodal Models）的训练。

来自主题: AI技术研报

8745 点击 2026-06-28 11:13

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

10452 点击 2026-05-12 08:53

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力：Multi-Token Prediction（MTP）推测解码架构，推理速度最高提升3倍，输出质量不变。

来自主题: AI资讯

9899 点击 2026-05-06 14:56

Anthropic一发布Multica就开源，这个4人团队想抢占AI协作层

4 月 9 日，Anthropic 在 X 上宣布 Claude Managed Agents 上线。同一天，一位 ID 叫 @jiayuan_jy 的中国创业者也发了一条推，“We created the open source version of Claude Managed Agents. Introducing Multica.”

来自主题: AI资讯

6644 点击 2026-05-06 14:56

AI「看不懂」、「做不好」视频的问题，混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script（MTSS），一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本"，通过 Stream Factorization 和 Relational Grounding 两大核心原则，让视频描述既忠实又可扩展，在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报

7189 点击 2026-04-28 09:57