AI资讯新闻榜单内容搜索-开源多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 开源多模态

HyperEyes：从「搜得更深」到「搜得更宽」，并行多模态搜索智能体的效率革命

HyperEyes：从「搜得更深」到「搜得更宽」，并行多模态搜索智能体的效率革命

HyperEyes：从「搜得更深」到「搜得更宽」，并行多模态搜索智能体的效率革命

现有的开源多模态搜索智能体普遍受困于「裁剪 - 再搜索」的串行处理模式，面对多目标时往往陷入交互冗长、错误级联累积的泥沼。

来自主题: AI技术研报

6053 点击 2026-05-20 09:52

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

独家获悉，字节跳动日前低调公布全球首个25B级、基于混合专家 (MoE) -扩散自注意力机制(DiT) 的开源增强统一多模态模型Mamoda2.5。Mamoda2.5依托Qwen3-VL-8B、128 个专家，Top-8 路由的MoE+DiT架构搭建，最终模型参数高达250亿，而每次仅激活约30亿参数（约12%）。

来自主题: AI资讯

10169 点击 2026-05-06 10:44

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

开源多模态生成领域，迎来架构级的底层突破。

来自主题: AI技术研报

10604 点击 2026-03-23 14:11

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

10B参数拥有媲美千亿级模型的多模态推理实力。

来自主题: AI技术研报

8288 点击 2026-01-21 12:02

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

全开源多模态大模型（MLLM）的性能，长期被闭源和半开源模型“卡脖子”。

来自主题: AI技术研报

8601 点击 2025-11-11 16:39

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA 于 2023 年提出，通过低成本对齐高效连接开源视觉编码器与大语言模型，使「看图 — 理解 — 对话」的多模态能力在开放生态中得以普及，明显缩小了与顶级闭源模型的差距，标志着开源多模态范式的重要里程碑。

来自主题: AI技术研报

10160 点击 2025-10-15 12:12

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

2B模型在多个基准位列4B参数以下开源第一。抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。

来自主题: AI技术研报

8397 点击 2025-10-13 15:58

更懂国内APP的开源智能体！感知/定位/推理/中文能力全面提升，还能自己学会操作

更懂国内APP的开源智能体！感知/定位/推理/中文能力全面提升，还能自己学会操作

更懂国内APP的开源智能体！感知/定位/推理/中文能力全面提升，还能自己学会操作

最新开源多模态智能体，能自动操作手机、电脑、浏览器的那种！开源评测榜单和中文场景交互成绩全面提升。

来自主题: AI技术研报

9747 点击 2025-09-01 10:55

刚刚，大模型装上「鹰眼」！首创高刷视频理解，谷歌Gemini 2.5完败

刚刚，大模型装上「鹰眼」！首创高刷视频理解，谷歌Gemini 2.5完败

刚刚，大模型装上「鹰眼」！首创高刷视频理解，谷歌Gemini 2.5完败

刚刚，面壁智能再放大招——MiniCPM-V 4.5多模态端侧模型横空出世：8B参数，越级反超72B巨无霸，图片、视频、OCR同级全线SOTA！不仅跑得快、看得清，还能真正落地到车机、机器人等。这一次，它不只是升级，而是刷新了端侧AI的高度。

来自主题: AI技术研报

10198 点击 2025-08-27 13:05

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

今天，我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型，成为行业首个具备“高刷”视频理解能力的多模态模型，看得准、看得快，看得长！高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA，且性能超过 Qwen2.5-VL 72B，堪称最强端侧多模态模型。

来自主题: AI资讯

11320 点击 2025-08-26 23:30

上一页当前第1页,共4页下一页