
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。
本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。
Anthropic推出Claude企业版,集成GitHub和500K上下文长度。
AI编程初创公司Magic发布1亿上下文窗口模型,编码能力超级加倍
一觉醒来,阿里Qwen的GitHub网页404了?!
最近,这个AI证件照神器狠狠火了~
Image-Matting(小宾AI抠图)是来自 GitHub 的一款免费、开源、无广告的,本地运行的基于 AI 的抠图应用。它简单好用,抠图效果好,目前支持 Windows、MacOS 等平台。
只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。
国产版Sora真的卷疯了。
GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。
离大谱!!不看视频完整版谁知道里面的美少女竟是一位大叔。