
一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?
一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?你有没有想过,为什么ChatGPT能够如此流畅地回答你的问题
你有没有想过,为什么ChatGPT能够如此流畅地回答你的问题
一句话就能让无人机起飞?
语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进架构,实现了接近真人的自然度与情感表达,广泛赋能智能助手、无障碍阅读、沉浸式娱乐等场景。
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
Sasame公司怀揣着“让AI听懂人心,让沟通回归自然”的愿景,致力于打造一种全新的、自然流程的人机交互体验,解决现有语音交互中理解不准确、沟通不流畅、应用场景受限等问题,通过可穿戴设备提供高品质音频,让AI伴侣观察世界,实现用户与AI的真实、自然交互。
近日,ISCA Fellow 2025 入选结果揭晓!
谷歌现象级产品NotebookLM,两个本科生自学3个月就复刻了?
在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。
两名没有高度专业 AI 知识的本科生表示,他们已经创建了一个公开可用的 AI 模型,可以生成类似于 Google 的 NotebookLM 的播客风格的剪辑。
在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音,更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。