
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench仅需一个强化学习(RL)框架,就能实现视觉任务大统一?
来自主题: AI技术研报
5578 点击 2025-05-28 10:41
仅需一个强化学习(RL)框架,就能实现视觉任务大统一?
"不要用移动互联网的逻辑来做AI"——这句来自MiniMax创始人闫俊杰的观点,在《晚点》刊发后迅速引发行业热议。它不仅道出了当下AI创业者的迷思,更揭示出整个行业正在经历的转折.
10 个月前,闫俊杰也接受过《晚点》访谈,那时他提了 16 次字节、47 次 OpenAI,8 次 Anthropic。这次再聊,他主动提字节少了,提 Anthropic 多了。这与行业风向形成微妙的反差。
继Sora、Runway之后,国内又一款AI视频生成模型来了!
大模型趋势的风向,开始变了。
一场关于非共识和长期最优解的对话。
和多数人一样,在看到 OpenAI 最新发布的「AI 智能助手」GPT-4o 时,MiniMax 创始人兼 CEO 闫俊杰的第一感觉是「惊艳」。他也为那些演示效果着迷,如丝滑的语音交互、实时的视觉理 解、语言捕捉甚至包括了「呼吸声」。