AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。

来自主题: AI技术研报
7314 点击    2024-04-29 20:45
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报
9154 点击    2024-04-28 13:46
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报
5390 点击    2024-04-26 17:24
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩散模型在推理过程中天然存在的多步数迭代去噪特性导致了较高的计算成本。

来自主题: AI技术研报
7326 点击    2024-04-25 17:13
时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选

时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选

时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选

刚刚,《时代》周刊发布了 2024 年度最具影响力的 100 人名单。 在这份名单中,我们看到了很多熟悉的学者和企业家。

来自主题: AI资讯
8156 点击    2024-04-22 17:38
字节Gauth,AI含量过高?

字节Gauth,AI含量过高?

字节Gauth,AI含量过高?

最近一段时间,“字节的 Gauth 增长很猛”的消息,四处流传。在上周写完《作业帮出海,拿下200万MAU》的选题之后,我们怀着好奇心,看看字节的 Gauth 是不是真的如一些自媒体吹得那么神,毕竟作业帮的 Question.AI 体验下来,还是有一些 bug 的。

来自主题: AI资讯
7210 点击    2024-04-19 17:01
Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我们让后者来挑战前者的主场,它能行吗?

来自主题: AI技术研报
9451 点击    2024-04-17 17:02
嗅觉数字化!AI还原记忆中的味道

嗅觉数字化!AI还原记忆中的味道

嗅觉数字化!AI还原记忆中的味道

人类嗅觉的数字化,它来了! 当今的计算机算法,尤其是AI技术,几乎已经把人类的视觉和听觉完全虚拟化了。

来自主题: AI资讯
7846 点击    2024-04-17 11:18