用155万模拟视频给模型上课!GVE模型一次学会9种视频检索技能 用155万模拟视频给模型上课!GVE模型一次学会9种视频检索技能 关键词: AI,GVE,模型训练,人工智能 当前视频检索研究正陷入一个闭环困境:以MSRVTT为代表的窄域基准,长期主导模型在粗粒度文本查询上的优化,导致训练数据有偏、模型能力受限,难以应对真实世界中细粒度、长上下文、多模态组合等复杂检索需求。 来自主题: AI技术研报 5342 点击 2025-11-14 09:41