大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准 大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准 关键词: AI,模型训练,Video-TT,模型基准 视频大型语言模型(Video LLMs)的发展日新月异,它们似乎能够精准描述视频内容、准确的回答相关问题,展现出足以乱真的人类级理解力。 来自主题: AI技术研报 5835 点击 2025-08-02 12:43