AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ima
豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

当前的视觉语言模型(VLM)主要通过 QA 问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如 detail image caption 性能的可靠评测手段。

来自主题: AI技术研报
9584 点击    2024-07-13 20:01
谁才是大模型“四小龙”?

谁才是大模型“四小龙”?

谁才是大模型“四小龙”?

大模型的船票,哪些公司拿到了?

来自主题: AI资讯
9787 点击    2024-07-13 12:09
9个大模型独角兽都在用飞书!通往AGI之路知识库免费get

9个大模型独角兽都在用飞书!通往AGI之路知识库免费get

9个大模型独角兽都在用飞书!通往AGI之路知识库免费get

无论是大模型独角兽们长在飞书上,还是最大AI科普发生在飞书上。AI正在与飞书产生越来越深入的关联。

来自主题: AI资讯
9933 点击    2024-07-11 21:39
将图像自动文本化,图像描述质量更高、更准确了

将图像自动文本化,图像描述质量更高、更准确了

将图像自动文本化,图像描述质量更高、更准确了

在当今的多模态大模型的发展中,模型的性能和训练数据的质量关系十分紧密,可以说是 “数据赋予了模型的绝大多数能力”。

来自主题: AI技术研报
5470 点击    2024-06-28 11:28
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。

来自主题: AI技术研报
9672 点击    2024-06-22 23:00
中国生成式AI的5大独角兽

中国生成式AI的5大独角兽

中国生成式AI的5大独角兽

在中国,最近1年内诞生了5家生成式AI独角兽:月之暗面、MiniMax、零一万物、百川智能、智谱AI。

来自主题: AI资讯
6791 点击    2024-06-20 13:46
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。

来自主题: AI资讯
8768 点击    2024-06-17 19:23