
首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜
首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜自 2024 年 GPT-4o 出现以来,业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内,中文语音合成大模型如雨后春笋般涌现,如 chattts、seedtts、cosyvoice 等。
自 2024 年 GPT-4o 出现以来,业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内,中文语音合成大模型如雨后春笋般涌现,如 chattts、seedtts、cosyvoice 等。
第一次拜访K-Scale Labs的时候,好像走进了美剧《硅谷》的拍摄现场。
在今天回顾过去一年 AI 应用层的进展,AI 搜索一定是难以忽视的一个方向。在很长的一段时间里,AI 搜索=Perplexity,在榜单上,几乎感受不到其他搜索产品的存在。
OpenAI的ChatGPT是全球工作中使用最多的生成式人工智能工具
超逼真的机器人小镇来了! 在这里,机器人可以像人一样在超市里购物
Fidelity-Scalability-Controllability-Accessibility (真实度-可扩展性-可控性-可用性)是生成式 AI 领域一个很好的研究方法论。会有更多像AnimateDiff这样的技术推动视频生成的广泛应用。
MoE 因其在训推流程中低销高效的特点,近两年在大语言模型领域大放异彩。作为 MoE 的灵魂,专家如何能够发挥出最大的学习潜能,相关的研究与讨论层出不穷。此前,华为 GTS AI 计算 Lab 的研究团队提出了 LocMoE ,包括新颖的路由网络结构、辅助降低通信开销的本地性 loss 等,引发了广泛关注。
李飞飞创办World Labs,估值超10亿美元。
「AI教母」创业,3个月就干出了估值10亿的AI独角兽。
给全球 80 亿人提供大规模、按需的个性化教育。