AI资讯新闻榜单内容搜索-人工智能

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 人工智能
SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

随着生成式 AI 的快速发展,从文本生成图像、视频,到构建完整的三维世界,AI “创造空间” 的能力正以前所未有的速度突破边界。然而,现有 3D 场景生成方法仍存在明显局限:模型往往直接输出每个物体的几何参数(位置、大小、方向等),结果容易出现漂浮、重叠、穿模等问题;场景结构缺乏逻辑一致性,难以编辑或复用,更无法像程序那样精确控制空间关系与生成逻辑。

来自主题: AI技术研报
8986 点击    2025-11-17 14:33
偶然刷到的一个逆天项目:AI黑客...

偶然刷到的一个逆天项目:AI黑客...

偶然刷到的一个逆天项目:AI黑客...

做过独立开发的朋友都清楚,虽然现在 AI 已经能写出相当不错的前端,后端也有成熟的 BaaS 服务,但应用开发并不仅仅只是写份代码。

来自主题: AI技术研报
5522 点击    2025-11-17 14:33
Lumina-DiMOO:多模态扩散语言模型重塑图像生成与理解

Lumina-DiMOO:多模态扩散语言模型重塑图像生成与理解

Lumina-DiMOO:多模态扩散语言模型重塑图像生成与理解

上海人工智能实验室推出了一款革新的多模态生成理解一体化的扩散语言模型 ——Lumina-DiMOO。基于离散扩散建模(Discrete Diffusion Modeling),Lumina-DiMOO 打破了多模态任务之间的壁垒,在同一离散扩散框架下,完成从 文本→图像、图像→图像、图像→文本的全栈能力闭环。

来自主题: AI技术研报
7591 点击    2025-11-17 14:33
千问APP悄悄上线,阿里的AI超级入口也终于来了。

千问APP悄悄上线,阿里的AI超级入口也终于来了。

千问APP悄悄上线,阿里的AI超级入口也终于来了。

昨天,阿里的千问APP,在应用商店里。终于悄悄上线了。从之前的通义APP的双色渐变,变成了现在的属于千问的单色。功能增加了很多,模型也支持了Qwen全系列最新模型。

来自主题: AI资讯
7758 点击    2025-11-17 10:49
AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了

AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了

AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了

憨豆先生坐在《猫和老鼠》的客厅里,汤姆在一旁跌进油漆桶,杰瑞躲在沙发后偷笑。这一幕,不是梦,也不是恶搞,而是AI真实生成的画面。在最新一篇论文中,研究者让从未共存的角色相遇,并解决了「风格错乱」的世纪难题。也许,我们正在迎接一个虚构与真实彻底混合的时代。

来自主题: AI技术研报
9160 点击    2025-11-17 10:21
LLM为什么能替你操作电脑?4个关键技术让AI拥有"操作系统级"能力|Agent和工作流的区别就在这

LLM为什么能替你操作电脑?4个关键技术让AI拥有"操作系统级"能力|Agent和工作流的区别就在这

LLM为什么能替你操作电脑?4个关键技术让AI拥有"操作系统级"能力|Agent和工作流的区别就在这

如何构建一个真正意义上的“自主代理”(Agent),而不是一个“带LLM的高级工作流”? 让钢铁侠中的“贾维斯”(J.A.R.V.I.S.)真正来到现实,不仅能对话,还能调动资源、控制机械、在复杂战局中自主执行多步任务。

来自主题: AI技术研报
6472 点击    2025-11-17 10:19
NeurIPS 2025 Spotlight | NYU提出QSVD,仅数学压缩让模型更轻、更快、更稳

NeurIPS 2025 Spotlight | NYU提出QSVD,仅数学压缩让模型更轻、更快、更稳

NeurIPS 2025 Spotlight | NYU提出QSVD,仅数学压缩让模型更轻、更快、更稳

在多模态智能浪潮中,视觉语言模型(Vision-Language Models, VLM)已成为连接视觉理解与语言生成的核心引擎。从图像描述、视觉问答到 AI 教育和交互系统,它们让机器能够「看懂世界、说人话」。

来自主题: AI技术研报
8374 点击    2025-11-17 09:53