AI资讯新闻榜单内容搜索-多模态

多模态预训练，才是大模型的下一条路？Yann LeCun、谢赛宁参与

基础模型时代，大模型能力的爆发，很大程度上源于在海量文本上的预训练。然而问题在于，文本本质上只是人类对现实世界的一种抽象表达，是对真实世界信息的有损压缩。

来自主题: AI技术研报

9353 点击 2026-03-09 09:53

多模态大模型的研发范式，正在被彻底重构。

来自主题: AI技术研报

5743 点击 2026-03-09 09:51

刚刚，YuanLab.ai团队正式开源发布源Yuan3.0 Ultra多模态基础大模型。

来自主题: AI技术研报

9587 点击 2026-03-06 10:08

最近关于Qwen3.5还有其幕后团队，市场上的讨论沸沸扬扬，但今天我们不聊八卦，主要讲讲干货。

来自主题: AI技术研报

8714 点击 2026-03-06 09:33

统一多模态模型在多模态内容理解与生成方面已展现出良好效果，但目前仍主要局限于图像领域。

来自主题: AI技术研报

6936 点击 2026-03-06 09:31

伴随多模态大模型的发展，GUI Agent正成为人机交互的新范式。

来自主题: AI技术研报

8295 点击 2026-03-04 13:43

没有图片，也能预训练多模态大模型?在多模态大模型（MLLM）的研发中，行业内长期遵循着一个昂贵的共识：没有图文对（Image-Text Pairs），就没有多模态能力。

来自主题: AI技术研报

8257 点击 2026-03-03 14:25

我天！感觉 Seed 1.8 发布还没多久，没想到 Doubao-Seed-2.0 这么快就杀到了…今天发都算是晚讯了。据官方介绍，这次 Seed 2.0 多模态理解能力全面升级，还强化了 LLM 与 Agent 能力，模型在真实长链路任务中可以稳定推进。

来自主题: AI资讯

9146 点击 2026-03-02 23:22

DeepSeek V4下周登场：原生多模态，绕过英伟达，针对国产芯片深度优化。华尔街最怕的那条逻辑可能又要重演：算力霸权松动，美股先颤抖。

来自主题: AI资讯

8910 点击 2026-03-01 16:38

Meta联合多所高校发布首个可规模化自动生成第一视角音视频理解数据的引擎EgoAVU ，让多模态大模型首次真正「听懂世界」。

来自主题: AI技术研报

8658 点击 2026-02-28 15:26