北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token
北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT
提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT
我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同
通过什么方式够实现通用人工智能? 近期由AGI House组织的一场主题演讲给出了解答。
120秒超长AI视频模型来了!不但比Sora长,而且免费开源
前两天刚刚疯传的Suno挑战者、“音乐版Sora”正式现真身: 正式名称Udio,已完全免费开放,每人每月有足足1200首额度,网友们都玩疯了。
大语言模型的效率,正在被这家「清华系」创业公司发展到新高度。
去年 4月, 生成式 AI在国内热度正盛的时候,毒眸造访了几家 AI公司, 创业者们对于 AI的态度是大胆、积极和乐观的。
国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后,整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路,他们赌赢了:比OpenAI提前押中了Sora架构,并且首次在业内公开技术图。
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/英特尔
AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?