AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
告别「边画边说」:LatentMorph 开启视觉生成隐式潜空间推理新范式

告别「边画边说」:LatentMorph 开启视觉生成隐式潜空间推理新范式

告别「边画边说」:LatentMorph 开启视觉生成隐式潜空间推理新范式

人类在创作艺术时,大脑并非一味地输出,而是在每一笔落下时都在进行着复杂的、难以言表的 “视觉优化”。

来自主题: AI技术研报
9151 点击    2026-03-05 14:25
速递|Pinterest集中资源转向AI,获Elliott 10亿美金背书,新功能AI视觉搜索、AI购物助手

速递|Pinterest集中资源转向AI,获Elliott 10亿美金背书,新功能AI视觉搜索、AI购物助手

速递|Pinterest集中资源转向AI,获Elliott 10亿美金背书,新功能AI视觉搜索、AI购物助手

激进投资者艾略特投资管理公司已持有Pinterest 价值 10 亿美元股份,该公司以积极参与企业决策而闻名。该机构首次投资这家社交平台是在 2022 年。

来自主题: AI资讯
8805 点击    2026-03-05 09:09
ICLR 2026 | 当视频难以被表征:UCSD、HKUST等机构联合提出FlowRVS,用生成式流匹配重构视觉感知范式

ICLR 2026 | 当视频难以被表征:UCSD、HKUST等机构联合提出FlowRVS,用生成式流匹配重构视觉感知范式

ICLR 2026 | 当视频难以被表征:UCSD、HKUST等机构联合提出FlowRVS,用生成式流匹配重构视觉感知范式

长期以来,计算机视觉领域陷入了一个 “表征(Representation)” 的执念。我们习惯设计各种精巧的 Encoder,试图将动态世界压缩成一组特征向量。然而,视频作为现实的高维投影,其熵值之高、动态之复杂,让这种试图 “定格” 的表征显得力不从心。

来自主题: AI技术研报
6223 点击    2026-03-05 09:08
GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

OpenAI 意外泄露 GPT-5.4!新版凭 200 万 Tokens 与「状态化 AI」实现跨会话持久记忆,并支持全分辨率视觉直读。AI 将从聊天工具向「全自动代理」进化,彻底重塑工作流并引爆底层硬件内存之战。

来自主题: AI资讯
10279 点击    2026-03-03 10:56
人人皆可好莱坞,生成式媒体大爆发

人人皆可好莱坞,生成式媒体大爆发

人人皆可好莱坞,生成式媒体大爆发

从电商团队到视觉设计师,如今任何人都能在几分钟内生成数百张可投入生产的图片。几年前,这样的产量需要数千名摄影师、工作室和制作人员。长期以来支配电商及其他数字领域的成本结构已经发生了转变。传统的内容生产

来自主题: AI资讯
8087 点击    2026-02-24 09:13
ICLR 2026|新版「图灵测试」:当VLA走进生物实验室

ICLR 2026|新版「图灵测试」:当VLA走进生物实验室

ICLR 2026|新版「图灵测试」:当VLA走进生物实验室

现有 VLA 模型的研究和基准测试多局限于家庭场景(如整理餐桌、折叠衣物),缺乏对专业科学场景(尤其是生物实验室)的适配。生物实验室具有实验流程结构化、操作精度要求高、多模态交互复杂(透明容器、数字界面)等特点,是评估 VLA 模型精准操作、视觉推理和指令遵循能力的理想场景之一。

来自主题: AI技术研报
7323 点击    2026-02-20 13:00
苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

据彭博社记者 Mark Gurman 爆料,苹果正在加速推进三款全新的 AI 可穿戴设备。这三款产品都将围绕 Siri 数字助手构建,通过摄像头获取视觉上下文来执行各种操作。

来自主题: AI资讯
10712 点击    2026-02-18 13:37
阿里千问你别太荒谬!Qwen AI Slides 连漫画PPT都能一键生成?我以前那些夜真是白熬了

阿里千问你别太荒谬!Qwen AI Slides 连漫画PPT都能一键生成?我以前那些夜真是白熬了

阿里千问你别太荒谬!Qwen AI Slides 连漫画PPT都能一键生成?我以前那些夜真是白熬了

千问前脚刚把Qwen-Image-2.0甩出来,后脚就又放大招,冲着牛马党学生党的「痛处」下手了——就在这两天,重磅发布了AI PPT生成工具:Qwen AI Slides(幻灯片),据说从内容结构到视觉配图,一套全包……

来自主题: AI资讯
9898 点击    2026-02-16 11:24
视听分离SOTA提速6倍!清华发布首个6M高性能模型|ICLR'26

视听分离SOTA提速6倍!清华发布首个6M高性能模型|ICLR'26

视听分离SOTA提速6倍!清华发布首个6M高性能模型|ICLR'26

清华大学团队推出的Dolphin模型突破了「高性能必高能耗」的瓶颈:仅用6M参数(较主流模型减半),通过离散化视觉编码和物理启发的热扩散注意力机制,实现单次推理即可精准分离语音,速度提升6倍以上,在多项基准测试中刷新纪录,为智能助听器、手机等端侧设备部署高清语音分离开辟新路。

来自主题: AI技术研报
9034 点击    2026-02-14 10:28