让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni 让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni 关键词: Mini-Omni,AI,语音对话模型,开源模型,TTS 本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。 来自主题: AI技术研报 7290 点击 2024-09-07 11:04