
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。
来自主题: AI技术研报
6535 点击 2025-04-25 09:56
复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。