AI资讯新闻榜单内容搜索-文本转语音

美团开源“语音克隆”模型，1B/3.5B双选，超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚，美团LongCat团队发布了文本转语音模型LongCat-AudioDiT，并开源1B、3.5B参数量的版本。这一模型的最大特点，是彻底抛弃了梅尔谱等中间表示，直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说，这一模型直接根据声音本身的规律进行生成，“雕刻”出最原始的声音波形，从根源阻断数据转换的级联误差。

来自主题: AI资讯

9110 点击 2026-04-02 13:51

完爆ChatGPT！谷歌这招太狠：连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型，不仅能保留语调进行实时语音翻译，更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯

10357 点击 2025-12-15 11:36

B站出海的强有力支柱：最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

最近在 B 站上，你是否也刷到过一些 “魔性” 又神奇的 AI 视频？比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色，连情感和韵律都做到了高度还原！更让人惊讶的是，它们居然全都是靠 AI 生成的！

来自主题: AI技术研报

8845 点击 2025-09-18 15:54

B站神级配音AI被曝光！一个「意外泄露」的视频，让鬼畜区UP主都沉默了

最近一个「泄露」的文本转语音模型演示版本在 Reddit 上火了。这个「泄露」的演示视频被网友贴出来后，评论区一片惊呼。

来自主题: AI资讯

9254 点击 2025-07-15 11:01

最强中文TTS！设计任何音色+情感注入，效果绝了～【附实操】

今天咱们再聊聊TTS（文本转语音）这个话题。4月份给大家分享了MiniMax的TTS平台：MiniMax Audio当时我直呼它是最强中文TTS，那篇反响还不错，主要他们Speech-02-HD的效果确实NB

来自主题: AI资讯

12533 点击 2025-07-11 11:44

AI文本转语音进入“Next Level”！独角兽ElevenLabs发布Eleven v3：狠狠拿捏情感控制

AI文本转语音已经进化到这种程度了吗？(⊙ˍ⊙)莎士比亚戏剧腔、体育赛事激情解说、沉浸式有声书等诸多玩法简直轻松拿捏，而且听起来确实人机傻傻分不清楚~

来自主题: AI资讯

9502 点击 2025-06-07 12:05

语音合成突破：F5R-TTS首次实现非自回归模型的GRPO优化，零样本克隆性能显著提升

在人工智能技术日新月异的今天，语音合成（TTS）领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音，更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。

来自主题: AI技术研报

8741 点击 2025-04-19 14:08

GDC上的中国游戏AI智能体们

关于AI智能体，GDC上腾讯游戏魔方工作室分享了《F.A.C.U.L：首个懂人类语言的 FPS AI 队友》的演讲(这个技术去年就有曝光)，项目融合语音输入、大语言模型、实时文本转语音等生成式AI技术，让玩家能与AI队友沉浸式协同作战。

来自主题: AI资讯

9479 点击 2025-03-30 11:28

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

就在刚刚，OpenAI 宣布在其 API 中推出全新一代音频模型，包括语音转文本和文本转语音功能，让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍，新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练，能更好地捕获语音细微差别，减少误识别，大幅提升转录可靠性。

来自主题: AI资讯

11854 点击 2025-03-21 08:27

速递｜Podcastle推出超450种AI文本转语音模型，是竞对价格的一半

播客录制和编辑平台 Podcastle ，如今也加入了 AI 文本转语音竞赛，发布了其名为 Asyncflow v1.0 的 AI 模型。同时，还将为开发者提供 API，使他们能够直接将文本转语音模型集成到自己的应用中。

来自主题: AI资讯

7910 点击 2025-03-06 10:14