J.P. Morgan 2024年AI技术与行业发展研究总结(中文翻译)
J.P. Morgan 2024年AI技术与行业发展研究总结(中文翻译)摩根大通(J.P. Morgan)在2024年9月发布“Investable AI Summary of J.P. Morgan research and industry developments in 2024”关于人工智能(AI)2024年的研究和行业发展总结。
搜索
摩根大通(J.P. Morgan)在2024年9月发布“Investable AI Summary of J.P. Morgan research and industry developments in 2024”关于人工智能(AI)2024年的研究和行业发展总结。
这篇文章是笔者之前AI手写连笔书法生成的一个工作,是联合中央美院几位非常知名的老师完成的。当时提出的思路相对简单,主要结构是基于对抗生成网络(GAN)。虽然方法在大模型横行今天可能已经不算太新颖,但近期一些基于diffusion的AIGC工作还是关注到了这篇文章,并产生了一些启发。笔者认为这些灵感仍具有一定价值,因此在这里做个分享。由于一些公式和指标不太友好,为了不影响阅读故省略。
Flux 带起又一波文生图模型的热潮,NightCafe 是其中的受益者之一。
三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。
在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。
脑机接口(BCI)在科研和应用领域的进展在近期屡屡获得广泛的关注,大家通常都对脑机接口的应用前景有着广泛的畅享。
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。
我有一个朋友,中年被裁、股市爆仓、子女厌学……但是他毫不气馁,不怨天地,每天除了钓鱼、打游戏,剩下的时间都用来积极思考新的创业良机。
拖动式图像编辑是一种新型的、用户交互式的图像编辑方法。