AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
Light-X来了!全球首个「镜头×光照」双控4D视频生成框架,单目视频秒变电影级

Light-X来了!全球首个「镜头×光照」双控4D视频生成框架,单目视频秒变电影级

Light-X来了!全球首个「镜头×光照」双控4D视频生成框架,单目视频秒变电影级

仅凭一段随手拍摄的单目视频,是否能够让镜头在空间中自由飞行,让光线随意变换,让原本固定的真实场景在全新的视角与照明条件下被再次「拍摄」?这一过去被视作科幻设想的问题,如今迎来了明确答案。

来自主题: AI技术研报
8849 点击    2025-12-10 10:21
让AI像巴甫洛夫的狗一样学习?北航团队提出智能基础模型,跨越生物与AI鸿沟

让AI像巴甫洛夫的狗一样学习?北航团队提出智能基础模型,跨越生物与AI鸿沟

让AI像巴甫洛夫的狗一样学习?北航团队提出智能基础模型,跨越生物与AI鸿沟

假如你正在教一只小狗学习新技能。当你摇响铃铛然后给它食物,重复几次之后,只要一摇铃铛,即使没有食物,小狗也会留着口水跑过来。这就是著名的巴甫洛夫实验,它展现了生物是如何学习的。

来自主题: AI技术研报
5486 点击    2025-12-10 09:59
Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局

Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局

Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局

Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的内容,会被模型直接解释为生成指令,简化了图像生成过程中的控制流程。

来自主题: AI技术研报
9877 点击    2025-12-09 14:40
全图与切片并非等价?LLaVA-UHD-v3揭示差异推出高效全图建模方案

全图与切片并非等价?LLaVA-UHD-v3揭示差异推出高效全图建模方案

全图与切片并非等价?LLaVA-UHD-v3揭示差异推出高效全图建模方案

随着多模态大模型(MLLMs)在各类视觉语言任务中展现出强大的理解与交互能力,如何高效地处理原生高分辨率图像以捕捉精细的视觉信息,已成为提升模型性能的关键方向。

来自主题: AI技术研报
9231 点击    2025-12-09 14:38
准确率腰斩!大模型视觉能力一出日常生活就「失灵」

准确率腰斩!大模型视觉能力一出日常生活就「失灵」

准确率腰斩!大模型视觉能力一出日常生活就「失灵」

我们习惯了AI在屏幕上侃侃而谈、生成美图,好像它无所不知。但假如把它“扔”进一个真实的手术室,让它用主刀医生的第一视角来判断下一步该用哪把钳子,这位“学霸”很可能当场懵圈。

来自主题: AI技术研报
8675 点击    2025-12-09 10:37
如何优化英伟达CAGRA,实现GPU建图+CPU查询,成本效率兼顾

如何优化英伟达CAGRA,实现GPU建图+CPU查询,成本效率兼顾

如何优化英伟达CAGRA,实现GPU建图+CPU查询,成本效率兼顾

本文为Milvus Week系列第5篇,该系列旨在把Zilliz团队过去半年多积累的先进的技术实践和创新整理成多篇干货深度文章发布。

来自主题: AI技术研报
7736 点击    2025-12-09 10:36
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限

从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限

从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限

今年以来,开源项目LightX2V 及其 4 步视频生成蒸馏模型在 ComfyUI 社区迅速走红,单月下载量超过 170 万次。越来越多创作者用它在消费级显卡上完成高质量视频生成,把“等几分钟出一段视频”变成“边看边出片”。

来自主题: AI技术研报
8730 点击    2025-12-08 14:46