AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI语音
让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

Voice Agent 赛道正在爆发,但它迫切需要一个能让对话真正「流动起来」的底层引擎,一个能撑起下一代交互体验的 TTS 模型。竞争的焦点,已经从 LLM 的「大脑」,延伸到了 TTS 的「嗓音」。谁掌握嗓音,谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型,似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯
7613 点击    2025-10-31 15:35
语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

杜克大学和 Adobe 最近发布的 VERA 研究,首次系统性地测量了语音模态对推理能力的影响。研究覆盖 12 个主流语音系统,使用了 2,931 道专门设计的测试题。

来自主题: AI技术研报
6540 点击    2025-10-18 12:08
速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

Keplar 是一家市场调研初创公司,该公司运用语音 AI 技术进行客户访谈,能以远低于传统调研咨询公司的成本,为客户提供更快速的分析报告。

来自主题: AI资讯
6024 点击    2025-09-23 15:02
靠给用户念书,AI语音产品移动端月入千万

靠给用户念书,AI语音产品移动端月入千万

靠给用户念书,AI语音产品移动端月入千万

两年过去,ElevenLabs 已经融资 2.6 亿美元,网站访问量超 2500 万,稳坐 AI Web 全球 Top50 榜单,成为 AI 语音赛道的头部创企。而 Speechify 却渐渐“掉队”,榜单中难觅身影,而作为一个 AI 企业,它仅在 2017 和 2020 年有过两次融资,近几年也没有传出任何融资消息。

来自主题: AI资讯
8651 点击    2025-09-17 09:40
刚刚!阿里发新模型,幻觉率爆降70%

刚刚!阿里发新模型,幻觉率爆降70%

刚刚!阿里发新模型,幻觉率爆降70%

智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。

来自主题: AI技术研报
8089 点击    2025-09-16 11:23
安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

一句语音指令,复杂操作自动完成。安卓正迎来一场由AI语音快捷指令主导的交互革命,Shortcuts for Android (SFA) 不仅填补了与iOS快捷指令的差距,更正在重新定义人们与移动设备的互动方式。

来自主题: AI资讯
8957 点击    2025-09-14 11:37
硅谷顶级VC如何看语音AI?Greylock合伙人揭秘语音Agent构建的三层策略

硅谷顶级VC如何看语音AI?Greylock合伙人揭秘语音Agent构建的三层策略

硅谷顶级VC如何看语音AI?Greylock合伙人揭秘语音Agent构建的三层策略

我们每天都在用语音交流,从早上叫醒Siri到晚上和家人通话,语音似乎是人类最直观的交流方式。但当我们试图让机器也用这种方式与我们互动时,却发现背后隐藏着巨大的技术挑战。

来自主题: AI资讯
7359 点击    2025-08-30 18:13
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响

突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响

突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响

微软紧跟OpenAI的节奏,在同一天也亲自下场发布了微软自研的两个大模型:语音模型MAI-Voice-1和通用模型MAI-1-preview。对于这位老大哥,亲自下场做的第一个AI大模型,效果究竟怎么样?

来自主题: AI资讯
8226 点击    2025-08-29 16:44
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。

来自主题: AI资讯
7950 点击    2025-08-29 14:20
470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

一个月前在德国被50多家投资人拒绝的AI创业公司,搬到硅谷后却能在一周内完成470万美元的融资,而且投资人几乎全部说"yes"。这不是什么励志鸡汤故事,而是Leaping AI创始人Kevin Wu的真实经历。

来自主题: AI资讯
7027 点击    2025-08-26 19:40