AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。

来自主题: AI技术研报
6136 点击    2025-06-10 14:45
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image也只能完成28.9%的任务,图像编辑评测新基准来了!360个全部由人类专家仔细思考并校对的高质量测试案例,暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报
8572 点击    2025-05-31 14:37
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。

来自主题: AI资讯
6578 点击    2025-05-31 14:26
中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报
8900 点击    2025-05-30 12:53
史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

今夜,谷歌彻底杀疯!2小时发布会,Gemini提及95次点亮全场。Gemini 2.5家族全系升级,Pro深度思考模型正刷榜。全新Imagen 4生成细节超逼真,Veo 3首次实现音视频融合。

来自主题: AI资讯
4785 点击    2025-05-21 12:16
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

刚刚,鹅厂把文生图卷出了新高度——发布混元图像2.0模型(Hunyuan Image 2.0),首次实现毫秒级响应,边说边画,实时生成!用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。

来自主题: AI资讯
7842 点击    2025-05-16 16:10
刚刚,OpenAI最强图像生成API上线,一张图1毛5

刚刚,OpenAI最强图像生成API上线,一张图1毛5

刚刚,OpenAI最强图像生成API上线,一张图1毛5

OpenAI推出图像生成API,低至0.02美元/张,支持多模态定制。

来自主题: AI资讯
8186 点击    2025-04-24 20:53
刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯
7790 点击    2025-04-24 09:44
HiDream:最强文生图开源模型,来自合肥

HiDream:最强文生图开源模型,来自合肥

HiDream:最强文生图开源模型,来自合肥

刚出道的 HiDream-I1,拿下了 Hugging Face 趋势榜第二(图像榜第一),Artificial Analysis 文生图第二,排在Midjourney、Google Imagen、FLUX、SDXL 之前,仅次于 GPT-4o 。

来自主题: AI资讯
9105 点击    2025-04-16 10:10