横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%
横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了sota性能。
来自主题: AI技术研报
9503 点击 2023-12-04 18:01
哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了sota性能。
视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。