AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: io
火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

Stable Audio Open:开源文本转音频模型。

来自主题: AI资讯
3053 点击    2024-07-25 11:09
半年过去,AI视频卷到哪儿了?

半年过去,AI视频卷到哪儿了?

半年过去,AI视频卷到哪儿了?

国产版Sora,谁最强?

来自主题: AI资讯
8466 点击    2024-07-23 19:27
无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

近日,MIT CSAIL 的一个研究团队(一作为 MIT 在读博士陈博远)成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起,提出了一种训练和采样范式:Diffusion Forcing(DF)。

来自主题: AI技术研报
4470 点击    2024-07-23 16:40
PPIO CEO姚欣:AI行业或将迎来一次泡沫破灭,但不要悲观

PPIO CEO姚欣:AI行业或将迎来一次泡沫破灭,但不要悲观

PPIO CEO姚欣:AI行业或将迎来一次泡沫破灭,但不要悲观

7月5日,PPTV创始人、PPIO派欧云联合创始人&CEO姚欣,与大家分享了AI世界相对确定的当下和充满想象力的远方,一同用前瞻性的眼光进行长期性规划,积极拥抱新技术。

来自主题: AI资讯
4281 点击    2024-07-16 11:02
MotionClone:无需训练,一键克隆视频运动

MotionClone:无需训练,一键克隆视频运动

MotionClone:无需训练,一键克隆视频运动

无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。

来自主题: AI技术研报
5379 点击    2024-07-15 14:10
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。

来自主题: AI资讯
10215 点击    2024-07-06 20:21
「吗喽」在想啥?AI读心术精准重建猕猴大脑图像,网友:我们成三体人了

「吗喽」在想啥?AI读心术精准重建猕猴大脑图像,网友:我们成三体人了

「吗喽」在想啥?AI读心术精准重建猕猴大脑图像,网友:我们成三体人了

荷兰拉德布德大学的研究团队通过定位大脑注意力机制,在AI「读心术」领域精确生成图像,能够依据大脑活动记录极为准确地重建猕猴所看到的内容。网友:这是人机融合的最终目标。

来自主题: AI技术研报
8728 点击    2024-07-05 16:27