AI资讯新闻榜单内容搜索-Audio

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Audio
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动,造就了不同品种广泛分布在世界各地的生命奇迹;同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报
7255 点击    2025-02-15 15:23
字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

在大语言模型和 AIGC 的热潮下,科研人员对构建「视觉对话智能体」(Visual Chat Agent)展现出极大兴趣。其中,可实时交互的人像生成技术(Audio-Driven Real-Time Interactive Head Generation)是实现链路中极为关键的一环。

来自主题: AI资讯
7617 点击    2024-12-24 15:44
NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

DeepMind 公布其正在开发一套创新的音频生成技术细节,也就是NotebookLM背后使用的语音技术。使 AI 能够生成更加自然的对话和高质量的音频。这些技术不仅提升了语音助手的交互性,还帮助多种应用在语音合成和对话生成上取得更大进展。

来自主题: AI技术研报
4268 点击    2024-10-31 15:26
腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

来自约翰斯·霍普金斯大学和腾讯AI实验室的研究人员推出了EzAudio,这是一种新的文本到音频(T2A)生成模型,承诺以前所未有的效率从文本提示中生成高质量的音效。这一进步标志着人工智能和音频技术的重大飞跃,解决了人工智能生成音频中的几个关键挑战。

来自主题: AI资讯
6519 点击    2024-10-08 19:01
火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

Stable Audio Open:开源文本转音频模型。

来自主题: AI资讯
3236 点击    2024-07-25 11:09
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。

来自主题: AI资讯
10419 点击    2024-07-06 20:21
Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。

来自主题: AI资讯
8523 点击    2024-06-07 10:40
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio 2.0,可以创作长达3分钟的音乐,哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望……

来自主题: AI技术研报
6393 点击    2024-04-04 16:06
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法。

来自主题: AI资讯
4242 点击    2024-02-07 21:52