AI资讯新闻榜单内容搜索-开源视觉模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源视觉模型
视觉推理模型Top1易主了,智谱GLM-4.6V开源

视觉推理模型Top1易主了,智谱GLM-4.6V开源

视觉推理模型Top1易主了,智谱GLM-4.6V开源

这一次,AI真的是快要砸掉我的饭碗了。智谱最新升级的新一代视觉推理模型——GLM-4.6V。在深度体验一波之后,我们发现写图文并茂的公众号推文,还只是GLM-4.6V能力的一隅。

来自主题: AI资讯
7538 点击    2025-12-09 00:50
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!

爆火全网FLUX.2重磅上线,开源版Nano Banana来了!

爆火全网FLUX.2重磅上线,开源版Nano Banana来了!

Black Forest Labs的开源视觉模型FLUX.2上新,这是一款专为现实创意工作流程打造,绝非演示噱头的生产力工具,与前代FLUX.1相比,实现了从「会画」到「懂你要画什么」的跃升。

来自主题: AI资讯
8220 点击    2025-11-26 14:12
久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

阔别九月,大家期待的 DeepSeek-VL2 终于来了!DeepSeek-MoE 架构配合动态切图,视觉能力再升级。从视觉定位到梗图解析,从 OCR 到故事生成,从 3B、16B 再到 27B,DeepSeek-VL2 正式开源。

来自主题: AI技术研报
11886 点击    2024-12-14 10:17
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V的开源替代方案来了!极低成本,性能却类似,清华、浙大等中国顶尖学府,为我们提供了性能优异的GPT-4V开源平替。

来自主题: AI资讯
8781 点击    2024-01-03 13:50