AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

随着生成式 AI 的快速发展，从文本生成图像、视频，到构建完整的三维世界，AI “创造空间” 的能力正以前所未有的速度突破边界。然而，现有 3D 场景生成方法仍存在明显局限：模型往往直接输出每个物体的几何参数（位置、大小、方向等），结果容易出现漂浮、重叠、穿模等问题；场景结构缺乏逻辑一致性，难以编辑或复用，更无法像程序那样精确控制空间关系与生成逻辑。

来自主题: AI技术研报

10513 点击 2025-11-17 14:33

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

上海人工智能实验室推出了一款革新的多模态生成理解一体化的扩散语言模型 ——Lumina-DiMOO。基于离散扩散建模（Discrete Diffusion Modeling），Lumina-DiMOO 打破了多模态任务之间的壁垒，在同一离散扩散框架下，完成从文本→图像、图像→图像、图像→文本的全栈能力闭环。

来自主题: AI技术研报

9220 点击 2025-11-17 14:33

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

9810 点击 2025-11-17 14:32

千问APP悄悄上线，阿里的AI超级入口也终于来了。

千问APP悄悄上线，阿里的AI超级入口也终于来了。

千问APP悄悄上线，阿里的AI超级入口也终于来了。

昨天，阿里的千问APP，在应用商店里。终于悄悄上线了。从之前的通义APP的双色渐变，变成了现在的属于千问的单色。功能增加了很多，模型也支持了Qwen全系列最新模型。

来自主题: AI资讯

11369 点击 2025-11-17 10:49

垃圾刷多了AI也会变蠢！“年度最令人不安的论文”

垃圾刷多了AI也会变蠢！“年度最令人不安的论文”

垃圾刷多了AI也会变蠢！“年度最令人不安的论文”

你知道有个全球年度词汇叫“脑损伤”（Brain Rot）吗？

来自主题: AI技术研报

6309 点击 2025-11-17 10:22

AI又封神了！华人新作直出憨豆+《猫和老鼠》，平行宇宙对上戏了

AI又封神了！华人新作直出憨豆+《猫和老鼠》，平行宇宙对上戏了

AI又封神了！华人新作直出憨豆+《猫和老鼠》，平行宇宙对上戏了

憨豆先生坐在《猫和老鼠》的客厅里，汤姆在一旁跌进油漆桶，杰瑞躲在沙发后偷笑。这一幕，不是梦，也不是恶搞，而是AI真实生成的画面。在最新一篇论文中，研究者让从未共存的角色相遇，并解决了「风格错乱」的世纪难题。也许，我们正在迎接一个虚构与真实彻底混合的时代。

来自主题: AI技术研报

10261 点击 2025-11-17 10:21

WithAnyone重磅开源：这可能是你见过最自然的AI合照模型

WithAnyone重磅开源：这可能是你见过最自然的AI合照模型

WithAnyone重磅开源：这可能是你见过最自然的AI合照模型

和任何人，去任何地方！复旦大学携手阶跃星辰打破 “复制粘贴” 魔咒，重磅推出全新 AI 合照生成模型 WithAnyone —— 只需上传照片，就能一键生成自然、真实、毫无违和感的 AI 合照！

来自主题: AI技术研报

10695 点击 2025-11-17 10:20

LLM为什么能替你操作电脑？4个关键技术让AI拥有"操作系统级"能力｜Agent和工作流的区别就在这

LLM为什么能替你操作电脑？4个关键技术让AI拥有"操作系统级"能力｜Agent和工作流的区别就在这

LLM为什么能替你操作电脑？4个关键技术让AI拥有"操作系统级"能力｜Agent和工作流的区别就在这

如何构建一个真正意义上的“自主代理”（Agent），而不是一个“带LLM的高级工作流”？让钢铁侠中的“贾维斯”（J.A.R.V.I.S.）真正来到现实，不仅能对话，还能调动资源、控制机械、在复杂战局中自主执行多步任务。

来自主题: AI技术研报

8249 点击 2025-11-17 10:19

图灵奖得主LeCun最后警告Meta！我搞了40年AI，大模型是死路

图灵奖得主LeCun最后警告Meta！我搞了40年AI，大模型是死路

图灵奖得主LeCun最后警告Meta！我搞了40年AI，大模型是死路

图灵奖得主LeCun与Meta分道扬镳！LLM邪路一条，「世界模型才是」未来。

来自主题: AI资讯

9865 点击 2025-11-17 09:54

NeurIPS 2025 Spotlight | NYU提出QSVD，仅数学压缩让模型更轻、更快、更稳

NeurIPS 2025 Spotlight | NYU提出QSVD，仅数学压缩让模型更轻、更快、更稳

NeurIPS 2025 Spotlight | NYU提出QSVD，仅数学压缩让模型更轻、更快、更稳

在多模态智能浪潮中，视觉语言模型（Vision-Language Models, VLM）已成为连接视觉理解与语言生成的核心引擎。从图像描述、视觉问答到 AI 教育和交互系统，它们让机器能够「看懂世界、说人话」。

来自主题: AI技术研报

9964 点击 2025-11-17 09:53

上一页当前第206页,共1096页下一页