AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。

来自主题: AI技术研报
9570 点击    2026-06-08 14:50
废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

北大彭宇新团队提出「美学照片重构」新任务,从摄影教学视频中自动构建数据集AesRecon,并开发两阶段模型AesFormer,通过优化构图、视角与人物姿态,提升照片的美感与艺术表现力。

来自主题: AI技术研报
9771 点击    2026-06-08 14:49
ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

近年来,大语言模型在数学、代码等任务上的表现不断刷新上限,但到了医疗诊断、故障排查这类真实世界任务里,真正困难的是让多个智能体在不确定的动态环境中持续协作推理。

来自主题: AI技术研报
9451 点击    2026-06-08 09:48
ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报
9668 点击    2026-06-08 09:47
DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报
8099 点击    2026-06-07 10:56
CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,

来自主题: AI技术研报
8873 点击    2026-06-07 10:54
重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。

来自主题: AI技术研报
7352 点击    2026-06-07 10:51