AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI语音
完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型,不仅能保留语调进行实时语音翻译,更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯
8885 点击    2025-12-15 11:36
喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制

喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制

喝点VC|a16z专访百亿美金AI语音独角兽11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制

关键在于,从加入那一刻起,你就能对公司产生影响。因此在团队中,你可能承担任何角色。资历长短不会决定你在层级中的位置。只要足够聪明、敏捷且充满热情,就能快速提升自我——这点确实很有帮助。

来自主题: AI资讯
9017 点击    2025-12-15 11:05
估值 7 亿美元的 AI 语音输入产品:语音输入的关键问题是听写,不是转录

估值 7 亿美元的 AI 语音输入产品:语音输入的关键问题是听写,不是转录

估值 7 亿美元的 AI 语音输入产品:语音输入的关键问题是听写,不是转录

键盘作为人机交互的主要工具,实质上是一个巨大且不自然的「输入、输出瓶颈」。在「后键盘时代(post-keyboard future)」,语音或许才是最好地交互方式。

来自主题: AI资讯
5762 点击    2025-12-05 10:35
速递|Google、Meta前团队融资7000万美元,法国Kyutai实验室成功孵化AI语音独角兽Gradium

速递|Google、Meta前团队融资7000万美元,法国Kyutai实验室成功孵化AI语音独角兽Gradium

速递|Google、Meta前团队融资7000万美元,法国Kyutai实验室成功孵化AI语音独角兽Gradium

一家名为Gradium 的巴黎人工智能语音初创公司,从非营利研究实验室中独立出来,并获得了 7000 万美元的融资,投资方包括前谷歌首席执行官埃里克·施密特和法国电信亿万富翁泽维尔·尼尔等一线投资者。

来自主题: AI资讯
8801 点击    2025-12-03 16:15
2026 年,企业全面拥抱语音 AI 智能体

2026 年,企业全面拥抱语音 AI 智能体

2026 年,企业全面拥抱语音 AI 智能体

a16z 指出:“模型开发的进展正在简化整个基础设施栈,使得语音智能体具备更低延迟和更高性能。这一提升主要出现在过去六个月内,得益于新一代对话模型的出现。”基于这些趋势,Deepgram 与 Opus Research 合作开展的《2025 语音 AI 状况调查报告》,基于 400 位商业领袖的洞察,涵盖十多个行业,分析了语音 AI 的应用现状与关键特性。

来自主题: AI技术研报
8983 点击    2025-11-30 11:52
被东北雨姐舔耳10小时后,我终于被AI asmr睡服了

被东北雨姐舔耳10小时后,我终于被AI asmr睡服了

被东北雨姐舔耳10小时后,我终于被AI asmr睡服了

谁能想到,AI把ASMR也给干了...... 那是一个困倦的午后,吃饱饭的我正瘫在工位上准备入眠。我瘫在椅子上,耳机里传来轻柔的ASMR助眠声音。那里的毛刷轻轻刮着麦克风,发出微弱的、令人神经愉悦的摩擦音。而我也在这声音的安抚下昏昏欲睡。

来自主题: AI资讯
8253 点击    2025-11-18 23:11
硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

来自AI语音独角兽公司ElevenLabs,刚刚发布了Scribe v2 Realtime实时语音转文本模型,网友表示:Next-Level。150毫秒的超低延迟,93.5%的高准确率,还覆盖了90多种语言。

来自主题: AI资讯
7898 点击    2025-11-13 08:19
翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

在7000多种人类语言中,只有少数被现代语音技术听见,如今这种不平等或将被打破。Meta发布的Omnilingual ASR系统能识别1600多种语言,并可通过少量示例快速学会新语言。以开源与社区共创为核心,这项技术让每一种声音都有机会登上AI的舞台。

来自主题: AI资讯
8421 点击    2025-11-12 08:38