AI资讯新闻榜单内容搜索-视觉大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉大模型
美图发布自研视觉大模型4.0,主打AI设计与AI视频

美图发布自研视觉大模型4.0,主打AI设计与AI视频

美图发布自研视觉大模型4.0,主打AI设计与AI视频

12月5-6日,主题为“未来AI设计”的美图创造力大会在厦门举行。美图公司发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,主打AI设计与AI视频。

来自主题: AI资讯
5308 点击    2023-12-06 17:24
计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能做对图形推理题,AGI火花再次出现了?计算机视觉的GPT时刻,来了!

来自主题: AI资讯
6029 点击    2023-12-04 18:15
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。

来自主题: AI资讯
6180 点击    2023-11-29 15:32
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源

北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源

北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源

AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。

来自主题: AI技术研报
5122 点击    2023-11-21 12:24
夸克网盘再次升级,播放器新增AI字幕功能

夸克网盘再次升级,播放器新增AI字幕功能

夸克网盘再次升级,播放器新增AI字幕功能

夸克网盘电脑端播放器已经支持视频5倍速播放、4K画质和多音轨播放等能力。在自研的AI视觉大模型技术帮助下,升级后的夸克网盘播放器支持AI字幕和文稿生成,更加方便用户理解和管理内容

来自主题: AI资讯
3832 点击    2023-10-24 17:44
联发科:70 亿 AI 大语言模型在 vivo 最新旗舰手机端侧落地

联发科:70 亿 AI 大语言模型在 vivo 最新旗舰手机端侧落地

联发科:70 亿 AI 大语言模型在 vivo 最新旗舰手机端侧落地

联发科今日宣布与 vivo 在 AI 领域深度合作和联调,率先实现了 10 亿和 70 亿 AI 大语言模型以及 10 亿 AI 视觉大模型在手机端侧的落地

来自主题: AI资讯
2941 点击    2023-10-18 13:44