AI资讯新闻榜单内容搜索-音频生成

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 音频生成
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。

来自主题: AI资讯
7788 点击    2025-05-15 14:14
炸裂!DeepMind 发布 Lyria 2 音乐生成模型!

炸裂!DeepMind 发布 Lyria 2 音乐生成模型!

炸裂!DeepMind 发布 Lyria 2 音乐生成模型!

Google DeepMind正式发布其最新的音乐生成模型Lyria2,标志着音乐创作领域人工智能又一重大突破。该新模型具备高保真音频生成和专业音质,为音乐家、制作人和创作者提供了更强大的工具。

来自主题: AI资讯
7833 点击    2025-04-27 09:16
速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

AI 初创公司 ElevenLabs,刚刚筹集了 1.8 亿美元巨额融资 ,主要以其音频生成能力而闻名。该公司通过推出首个独立语音转文本模型 Scribe,迈向了另一个技术方向。

来自主题: AI资讯
7999 点击    2025-02-27 14:33
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动,造就了不同品种广泛分布在世界各地的生命奇迹;同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报
7111 点击    2025-02-15 15:23
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

近年来,扩散模型(Diffusion Models)已成为生成模型领域的研究前沿,它们在图像生成、视频生成、分子设计、音频生成等众多领域展现出强大的能力。

来自主题: AI技术研报
6005 点击    2024-12-05 11:49
NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

DeepMind 公布其正在开发一套创新的音频生成技术细节,也就是NotebookLM背后使用的语音技术。使 AI 能够生成更加自然的对话和高质量的音频。这些技术不仅提升了语音助手的交互性,还帮助多种应用在语音合成和对话生成上取得更大进展。

来自主题: AI技术研报
4039 点击    2024-10-31 15:26
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘

音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘

音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘

近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔法也不过如此。

来自主题: AI资讯
3708 点击    2024-09-12 14:29
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。

来自主题: AI资讯
10252 点击    2024-07-06 20:21
Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。

来自主题: AI资讯
8395 点击    2024-06-07 10:40
字节大模型关键8人首次曝光!中科大北航西安交大校友,还有9000+被引数大佬

字节大模型关键8人首次曝光!中科大北航西安交大校友,还有9000+被引数大佬

字节大模型关键8人首次曝光!中科大北航西安交大校友,还有9000+被引数大佬

字节大模型团队,终于曝光! 这不是,字节刚刚启动大模型校招计划,招揽人才嘛—— 计划取名Top Seed,薪资TOP级别、算力数据管够,但仅面向应届博士生;前沿课题覆盖大模型、图像&视频生成、机器学习算法和系统以及音频生成和理解等方向。 另外还有一帮顶尖的技术导师团带队……等等,这不就是字节豆包大模型的背后团队吗?

来自主题: AI资讯
4852 点击    2024-05-22 18:42