AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

华中科技大学团队推出首个水下多模态大模型NAUTILUS,支持8种水下场景理解任务,并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题,性能超越现有模型,恶劣环境下表现更佳。

来自主题: AI技术研报
9905 点击    2025-11-12 17:16
阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

复杂的简历,AI也能读懂了。

来自主题: AI技术研报
8836 点击    2025-11-12 17:15
全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

在数字经济浪潮中,企业对于高效、精准的信息获取与决策支持的需求日益迫切。从前沿科学探索到行业趋势分析,再到企业级决策支持,一个能够从海量异构数据源中提取关键知识、执行多步骤推理并生成结构化或多模态输出的「深度研究系统」正变得不可或缺。

来自主题: AI技术研报
6481 点击    2025-11-12 17:05
杨植麟回复:Kimi K2训练用的H800!但“只花了460万美元”嘛…

杨植麟回复:Kimi K2训练用的H800!但“只花了460万美元”嘛…

杨植麟回复:Kimi K2训练用的H800!但“只花了460万美元”嘛…

Kimi K2 Thinking训练真的只花了460万美元?杨植麟亲自带队,月之暗面创始团队出面回应了。这不是官方数据。训练成本很难计算,因为其中很大一部分用于研究和实验。他们还透露训练使用了配备Infiniband的英伟达H800,GPU数量也比巨头的少,但充分利用了每一张卡。

来自主题: AI资讯
8551 点击    2025-11-12 10:52
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法,给定 3D 场景的一组带位姿的图像(即带有位置和方向的图像),3DGS 会迭代训练一个场景表示,该表示由大量各向异性 3D 高斯体组成,用以捕捉场景的外观和几何形状。

来自主题: AI技术研报
9971 点击    2025-11-12 10:51
上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

临床诊断并非一次性的「快照」,而是一场动态交互、不断「探案」的推理过程。然而,当下的大模型大多基于静态数据训练,难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查,并一步步抽丝剥茧,迈向正确诊断?

来自主题: AI技术研报
7657 点击    2025-11-12 10:24
ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥? 是否因人工采集海量交互数据需要高昂成本而望而却步? 又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚?

来自主题: AI技术研报
9648 点击    2025-11-12 09:32
从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni,统⼀视觉、⽂本、听觉与动作模态,实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据,引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报
8346 点击    2025-11-12 09:29
MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

在一场矿难救援中,时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行:浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图,识别路径,并精准定位自己的位置。

来自主题: AI技术研报
7622 点击    2025-11-12 08:51