AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。

来自主题: AI技术研报
11534 点击    2024-05-17 17:49
视觉语音交互毫无延迟,都成精了居然还不是GPT-5?

视觉语音交互毫无延迟,都成精了居然还不是GPT-5?

视觉语音交互毫无延迟,都成精了居然还不是GPT-5?

OpenaAI给2024年5月14日的这场发布会取名“春季功能更新”,就像它们形容当初ChatGPT的发布是一次“低调的研究预览”一样。

来自主题: AI资讯
10015 点击    2024-05-14 21:50
OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

北京时间 5 月 14 日凌晨,备受期待的 OpenAI 春季更新发布会上,CTO Mira Murati 宣布发布新的模型迭代版本——GPT-4o,o 代表「omnimodel」(全能模型),原生多模态,改进了文本、视觉和音频的能力。

来自主题: AI资讯
5226 点击    2024-05-14 21:47
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。

来自主题: AI技术研报
9665 点击    2024-05-10 23:32
智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

我们知道,球状星团是一种受引力束缚,成员由几万颗到数百万颗恒星组成的古老星团,在外观上大多呈球形,但也有可能受其他天体系统的引力影响使得形状偏离球形。球状星团的动力学演化过程,星族合成路径等是当今天文学界的研究热点。

来自主题: AI技术研报
10045 点击    2024-05-07 18:15
AI教母李飞飞初创AI公司,开启最前沿AI算法研究

AI教母李飞飞初创AI公司,开启最前沿AI算法研究

AI教母李飞飞初创AI公司,开启最前沿AI算法研究

根据路透社5月4日消息,著名华人计算机科学家李飞飞正在建立一家初创公司。这家公司会利用类似人类对视觉数据的处理,使 AI 能够进行高级推理。这种AI算法使用的概念被称为“空间智能”。至于新公司的名字,还没有向外界披露。

来自主题: AI技术研报
9776 点击    2024-05-07 12:06
看透物体的3D表示和生成模型:NUS团队提出X-Ray

看透物体的3D表示和生成模型:NUS团队提出X-Ray

看透物体的3D表示和生成模型:NUS团队提出X-Ray

如今的生成式AI在人工智能领域迅猛发展,在计算机视觉中,图像和视频生成技术已日渐成熟,如Midjourney、Stable Video Diffusion [1]等模型广泛应用。然而,三维视觉领域的生成模型仍面临挑战。

来自主题: AI技术研报
5380 点击    2024-05-06 17:52
Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

自2021年诞生,CLIP已在计算机视觉识别系统和生成模型上得到了广泛的应用和巨大的成功。我们相信CLIP的创新和成功来自其高质量数据(WIT400M),而非模型或者损失函数本身。虽然3年来CLIP有大量的后续研究,但并未有研究通过对CLIP进行严格的消融实验来了解数据、模型和训练的关系。

来自主题: AI技术研报
12253 点击    2024-05-02 17:54