AI资讯新闻榜单内容搜索-TTS

全球第一！中国模型登顶榜首，首个可编辑AI语音来了

全球第一！中国AI语音ViiTorVoice首创「局部编辑」神技：配音错字告别重录，像改Word一样修语音。内附姆巴佩、哈兰德爆笑实测，快来见证！这个凭空出世的中国模型，将 Qwen3-TTS、CosyVoice3、Fish Audio 等一众主流巨头挑落马下，径直登顶综合排名第一！

来自主题: AI资讯

8671 点击 2026-07-04 10:52

速递｜Boson AI × SGLang 发布 Higgs Audio v3 TTS：让语音智能体实时可控

Boson AI 与 SGLang-Omni 团队宣布，SGLang-Omni 已完成对 Higgs Audio v3 TTS 的端到端 Serving 支持。作为一家成立于 2023 年的 AI 基础设施公司，李沐与 Alex Smola共同创立了 Boson AI，聚焦大模型时代的系统与基础设施创新。

来自主题: AI资讯

8911 点击 2026-06-06 10:18

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

语音合成这两年发展迅速：把一段话顺顺当当地念完，已经不算难事；难的是该慢的时候慢，该顿的时候顿，该强调的时候真能把重点托出来。

来自主题: AI技术研报

6207 点击 2026-05-13 10:00

小米双模型正式开源！MiMo-V2.5-Pro无中断肝出“macOS”：54个应用全开、浏览器真能冲浪

没错，用的就是主打长程任务、模糊指令遵循，跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列，包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型，综合实力对标国际顶尖水准。

来自主题: AI产品测评

8134 点击 2026-04-29 10:04

美团开源“语音克隆”模型，1B/3.5B双选，超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚，美团LongCat团队发布了文本转语音模型LongCat-AudioDiT，并开源1B、3.5B参数量的版本。这一模型的最大特点，是彻底抛弃了梅尔谱等中间表示，直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说，这一模型直接根据声音本身的规律进行生成，“雕刻”出最原始的声音波形，从根源阻断数据转换的级联误差。

来自主题: AI资讯

9704 点击 2026-04-02 13:51