AI资讯新闻榜单内容搜索-GA

旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

日前，旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架，用户只需输入一张静态的肖像图片，以及一段视频（演讲、表情包、rap）文件，即可生成一段表情丰富、动作一致的 AI 人像视频。

来自主题: AI资讯

11886 点击 2024-06-26 17:00

今年最大天使轮诞生了

具身机器人爆发。

来自主题: AI资讯

10056 点击 2024-06-25 10:26

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

在生成式模型的迅速发展中，Image Tokenization 扮演着一个很重要的角色，例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间（latent space），使得生成高分辨率图像更有效率。

来自主题: AI技术研报

11997 点击 2024-06-22 23:00

从高考到奥林匹克竞技场：大模型与人类智能的终极较量

图灵奖得主Hinton在他的访谈中提及「在未来20年内，AI有50%的概率超越人类的智能水平」，并建议各大科技公司早做准备，而评定大模型（包括多模态大模型）的「智力水平」则是这一准备的必要前提。

来自主题: AI资讯

4841 点击 2024-06-21 13:15

AI芯片的未来，未必是GPU

在商业需求更明确的未来，FPGA或ASIC将成为更优的底层计算设备。

来自主题: AI资讯

7648 点击 2024-06-20 13:56

高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

在三维生成建模的研究领域，现行的两大类 3D 表示方法要么基于拟合能力不足的隐式解码器，要么缺乏清晰定义的空间结构难以与主流的 3D 扩散技术融合。来自中科大、清华和微软亚洲研究院的研究人员提出了 GaussianCube，这是一种具有强大拟合能力的显式结构化三维表示，并且可以无缝应用于目前主流的 3D 扩散模型中。

来自主题: AI技术研报

11437 点击 2024-06-16 18:15