ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道
ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进架构,实现了接近真人的自然度与情感表达,广泛赋能智能助手、无障碍阅读、沉浸式娱乐等场景。
语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进架构,实现了接近真人的自然度与情感表达,广泛赋能智能助手、无障碍阅读、沉浸式娱乐等场景。
“科技行业里骗子和炒作者的数量之多,令人难以置信。”面对当下火热的 AI 浪潮,Java 之父直言不讳地对背后推波助澜的炒作者们发出尖锐批评。
全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token,创下了互联网上最大规模的预训练新纪录!去中心化AI的反攻,正式开始。OpenAI等巨头的算力霸权,这次真要凉了?
2023年,业界还在卷Scaling Law,不断突破参数规模和数据规模时,微软亚洲研究院张丽团队就选择了另一条路径。
这个周末,豆包上了视频通话。
五天前,一笔震惊科技圈的重磅收购案浮出水面。OpenAI宣布以高达65亿美元的价格,收购了由前苹果首席设计官Jony Ive创办的AI硬件公司io,并计划将其打造为一个专注消费级智能设备的核心部门。
国产智能体,这次真封神了。
只需知道6项个人信息,GPT-4就有可能在辩论中打败你?!
不久前,机器人马拉松的翻车名场面还记忆犹新,而刚刚,杭州也顺利举行了全球首个人形机器人格斗比赛,上演了一场现实版《铁甲钢拳》,
让我们把时钟拨回 2014 年 5 月,当刚完成博士后研究的 Dario Amodei 决定加入百度研究院(Baidu Research)时,他绝不会想到自己有朝一日能够亲手打造属于自己的 AI 帝国,并成为连谷歌和微软都无法撼动和忽视的强劲对手。
“以前需要3个月开发的网站,现在用Luna,只需3小时。”
大家好,我是袋鼠帝 还记得前两天Google IO大会上他们发布的最新视频模型Veo3吗 它可以根据提示自动添加环境音效、背景噪声、音乐和对话,并与画面完美同步 而且生成的视频相当炸裂,已经让我有点分不清虚幻与现实了 比如这位推特大神(Hashem Al-Ghaili)用Veo3制作的视频,相当🐂🍺
AI是否真正在「思考」乃至产生意识,正成为科学和哲学交汇的核心议题。前OpenAI负责人翁荔认为,增加模型的「思考时间」有助突破复杂推理瓶颈;哈佛等机构则指出思维链可能导致「降智」;而生物学家Mallavarapu断言数字计算机永不可能拥有意识。
这个开源项目,Star 攀升趋势巨快。
百度一季度业绩于2025年5月21日港股盘后放出,整体来看小超预期,简单来说,DeepSeek帮了大忙!
新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增 Qwen3-0.6B 线性层分类方法的效果。
从长期看,大多数内容将由AI生成。所以“这是不是AI生成的”这个问题将变得无意义真正。值得关注的是内容的来源、溯源和引用等问题。而讽刺的是,AI反而可能更有助于解决这些问题。
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
1986年,图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论:没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四十年后,这个深刻洞察在AI领域再次得到验证——你是否也曾经历过这样的挫折:
最近你是不是也被一系列“回答我”鬼畜视频刷屏?在各种社交软件上,明明上一秒还是一张静态照片,下一秒就能扭腰转身、街舞翻跳,甚至连兵马俑都能跳Kpop。
平台并非不欢迎AI,而是抵制千篇一律的同质化内容。
OpenAI初心不再,奥特曼「真面目」被揭穿!300次深度访谈、8年追踪调查,首位报道OpenAI的华人记者Karen Hao揭开震撼内幕:奥特曼如何「千人千面」,马斯克为何愤然出局,加速派与末日派如何联手推高AGI狂热……
AI成功找到Linux安全漏洞,还是内核级别的零日漏洞。
AI,已经热了快三年了。
想象一下,你是一位金融分析师,面前堆满了数百页的季报、SEC文件和市场数据,你需要在明天早上交出一份全面的行业分析报告。
Vending-Bench模拟环境可以测试大模型管理自动售货机的能力,结果显示,Claude 3.5 Sonnet表现最佳,人类屈居第四!
最近,AI 在数学和编程上的能力飞跃令人瞠目结舌 —— 在不少任务上,它已经悄然超越了我们大多数人类。而当它面对真正的专家,会发生什么?
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。
现有的数据合成方法在合理性和分布一致性方面存在不足,且缺乏自动适配不同数据的能力,扩展性较差。
就在刚刚,世界首个AI科学家天团首个成果重磅发布——治疗失明的新药被发现了,而且仅仅用时2.5个月!