田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型3 月 6 日,田渊栋又一项研究出炉,这次,他们主攻 LLM 内存效率。除了田渊栋本人,还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。
3 月 6 日,田渊栋又一项研究出炉,这次,他们主攻 LLM 内存效率。除了田渊栋本人,还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。
针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。
AI 研究走过的最大弯路,就是过于重视人类既有经验和知识。
谷歌决定不共享用于生成模型的数据,甚至不共享模型结果本身。唯一共享的数据是模型最终识别出的稳定晶体,这让人难以复现模型。
最近,英伟达宣布成立一个新研究部门——通用具身智能体研究实验室GEAR。令人意外的是,该实验室的领导者是两位华人90后博士——范麟熙(Jim Fan)和朱玉可(Yuke Zhu)。
谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。
近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。
一项最新研究发现,人工智能在创造力方面的表现超过了人类。通过对人类和AI参与者进行创造力测量任务的比较,研究显示AI在原创性和详细程度上具有明显优势。然而,真正的创造力远远超越了创新思想的产生,它还需要实践能力来解决现实世界问题。
一项世界前沿的医学研究,需要用多久才能被应用到平常老百姓的日常就医中?3个月。
ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用Stable Diffusion可以直接生成单个或多个透明图层(PNG)!