AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度可控性。开发者使用模型能够创建高度逼真的模拟环境,用于训练机器人和自动驾驶车辆。

来自主题: AI技术研报
7877 点击    2025-03-22 10:56
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学团队提出了ARINAR模型,与何凯明团队此前提出的分形生成模型类似,采用双层自回归结构逐特征生成图像,显著提升了生成质量和速度,性能超越了FractalMAR模型,论文和代码已公开。

来自主题: AI技术研报
6926 点击    2025-03-22 10:50
用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

当你要求AI"帮我订一张去纽约的机票"时,它需要理解目标、分解步骤、适应变化,这个过程远比看起来复杂。UC伯克利的研究者们带来了振奋人心的新发现:通过将任务规划和执行分离的PLAN-AND-ACT框架,他们成功将智能体在长期任务中的规划能力提升了54%,创造了新的技术突破。

来自主题: AI技术研报
5340 点击    2025-03-21 14:37
RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG工作发展时间线(2020年至今)。展示了RAG相关研究的三个主要领域:基础(包括RAG学习和RAG框架)、进阶和评估。关键的语言模型(GPT-3、GPT-4等)发展节点标注在时间线上。

来自主题: AI技术研报
8066 点击    2025-03-21 12:18
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍,新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练,能更好地捕获语音细微差别,减少误识别,大幅提升转录可靠性。

来自主题: AI资讯
9487 点击    2025-03-21 08:27
被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

前脚被谷歌点名感谢空间训练平台,后脚又开源了空间模型!杭州六小龙群核科技发了一个空间理解开源模型SpatialLM,让机器人刷一段视频,就能理解物理世界的几何关系。结合之前发布的空间智能训练平台SpatialVerse,群核科技要为机器人提供从空间认知到行动交互的训练闭环。机器人也被「卷」到要上学了。

来自主题: AI资讯
9197 点击    2025-03-20 17:34
华为诺亚综述:生成式模型如何用于决策?

华为诺亚综述:生成式模型如何用于决策?

华为诺亚综述:生成式模型如何用于决策?

近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。

来自主题: AI技术研报
7987 点击    2025-03-20 16:38