AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速

近年来,大规模视频扩散模型在视频生成领域取得了显著进展。然而,采样效率低下仍然是这类模型的核心瓶颈。

来自主题: AI技术研报
8490 点击    2026-03-11 15:05
物理AI的「原生」时刻:原力灵机发布具身大模型DM0

物理AI的「原生」时刻:原力灵机发布具身大模型DM0

物理AI的「原生」时刻:原力灵机发布具身大模型DM0

当前,大语言模型(LLMs)和视觉语言模型(VLMs)在语义领域的成功未能直接迁移至物理机器人,归根结底在于其互联网原生的基因。

来自主题: AI技术研报
5467 点击    2026-03-11 15:04
不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

不平衡数据下对比学习的理论分析:从训练动态到剪枝解决方案

对比学习已成为表征学习中的一种强大范式,能够在不依赖标签的情况下有效利用无标注数据。

来自主题: AI技术研报
6922 点击    2026-03-11 15:03
ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出 「ThinkMorph」,主张让文字与图像在统一架构里「原生协作」、「共同演化」,而不是像当下大多数多模态模型那样,看完图像就闭上眼睛,后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型,视觉推理平均提升 34.74%,多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报
6196 点击    2026-03-11 09:22
拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

拖拽视频编辑进入流式时代!任意时刻、任意内容,实时修改 | ICLR'26

DragStream,首次实现视频生成时的实时拖拽编辑。用户可随时拖动画面中的物体,自由平移、旋转或变形,系统自动保持后续帧连贯自然,无需重训模型,无缝适配主流AI视频生成器,真正实现「所见即所得」。

来自主题: AI技术研报
7531 点击    2026-03-10 14:32
正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

如果你在过去一年关注过大模型训练的技术,大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器,被视为是可能挑战 Adam 的新秀。它的思路很直接:对动量矩阵进行正交化,让各个奇异方向上的更新速率一致,提升训练效率。

来自主题: AI技术研报
5750 点击    2026-03-10 14:31