你有多久没在下五子棋的时候又唱又跳了?我用 AI 试了试
你有多久没在下五子棋的时候又唱又跳了?我用 AI 试了试你有多久没试过在用 AI 写歌的时候又唱又跳了?——没有人在用 AI 写歌的时候又唱又跳!这是 YouTube 上的一位音乐博主,本想用音乐生成软件做一些糟糕的 AI 音乐,取笑一下人工智能,却意外得到了「味挺正」的日本金属摇滚,一下子就在 TikTok 上迅速爆红。
你有多久没试过在用 AI 写歌的时候又唱又跳了?——没有人在用 AI 写歌的时候又唱又跳!这是 YouTube 上的一位音乐博主,本想用音乐生成软件做一些糟糕的 AI 音乐,取笑一下人工智能,却意外得到了「味挺正」的日本金属摇滚,一下子就在 TikTok 上迅速爆红。
在我们往期观察“AI+声音”的应用中,多是 TTS、AI 生成播客和读书/配音等方向,先有文字内容、后转化为声音输出的偏“工具”类产品。当大多数产品在探索如何用 AI 声音改变内容传播的形式时,一家德国厂商却在另一个方向持续耕耘,并且维持了不错的流水表现。
不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源 33 款、31 款各类型大模型。
你是不是也经常遇到“AI配音”的视频?
上篇文章和大家聊了自研的多维表格编辑器pxcharts。今天和大家继续分享一款我最近发现的宝藏AI工具——AI-Media2Doc。
文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外大模型。
空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。
音频初创公司 Krisp 周三宣布推出一项新功能,利用 AI 在通话中改变用户的口音。该公司首先推出的是帮助印度人在通话中听起来像美国人。
海豚的口哨声、大象的隆隆声、鸟鸣声的颤音,都具有该物种用于传递信息的模式和结构。对于人类来说,这些微妙之处可能难以识别和理解,但寻找模式正是AI所擅长的领域。