AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自主题: AI技术研报
6158 点击    2024-04-30 18:28
Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

来自主题: AI技术研报
7355 点击    2024-04-29 20:42
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报
9175 点击    2024-04-28 13:46
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报
5404 点击    2024-04-26 17:24
CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

图像融合的目的是将同一场景中不同传感器捕获的多源图像的互补信息整合到单个图像上。这种方式通常被用于提取图片重要信息和提高视觉质量。

来自主题: AI技术研报
4275 点击    2024-04-24 10:00
嗅觉数字化!AI还原记忆中的味道

嗅觉数字化!AI还原记忆中的味道

嗅觉数字化!AI还原记忆中的味道

人类嗅觉的数字化,它来了! 当今的计算机算法,尤其是AI技术,几乎已经把人类的视觉和听觉完全虚拟化了。

来自主题: AI资讯
7857 点击    2024-04-17 11:18