AI资讯新闻榜单内容搜索-训练

用两个LLM执行PLAN-AND-ACT，让Agent在长任务中提高规划能力54% | UC伯克利最新

当你要求AI"帮我订一张去纽约的机票"时，它需要理解目标、分解步骤、适应变化，这个过程远比看起来复杂。UC伯克利的研究者们带来了振奋人心的新发现：通过将任务规划和执行分离的PLAN-AND-ACT框架，他们成功将智能体在长期任务中的规划能力提升了54%，创造了新的技术突破。

来自主题: AI技术研报

6631 点击 2025-03-21 14:37

RAG发展图谱：从基础检索到记忆增强，再到自适应RAG的五大范式 | RAG最新综述

RAG工作发展时间线（2020年至今）。展示了RAG相关研究的三个主要领域：基础（包括RAG学习和RAG框架）、进阶和评估。关键的语言模型（GPT-3、GPT-4等）发展节点标注在时间线上。

来自主题: AI技术研报

10467 点击 2025-03-21 12:18

OpenAI加码写作赛道？阿里最新大模型通用写作能力基准WritingBench，揭秘深度思考能否增进文学表达

全面评估大模型生成式写作能力的基准来了！

来自主题: AI技术研报

10375 点击 2025-03-21 11:39

AI视频是否符合物理规律，量化基准来了，实现人类感知对齐 | 阿里高德/中科院出品

测一测现有AI生成视频是否符合物理运动规律！

来自主题: AI技术研报

4887 点击 2025-03-21 10:35

一张图，快速生成可拆分3D角色！腾讯清华新SOTA | CVPR 2025

任意一张立绘，就可以生成可拆分3D角色！

来自主题: AI技术研报

7521 点击 2025-03-21 10:13

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

就在刚刚，OpenAI 宣布在其 API 中推出全新一代音频模型，包括语音转文本和文本转语音功能，让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍，新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练，能更好地捕获语音细微差别，减少误识别，大幅提升转录可靠性。

来自主题: AI资讯

11536 点击 2025-03-21 08:27

被谷歌点名感谢！杭州六小龙开源黑科技，让机器人瞬间「悟透」3D世界

前脚被谷歌点名感谢空间训练平台，后脚又开源了空间模型！杭州六小龙群核科技发了一个空间理解开源模型SpatialLM，让机器人刷一段视频，就能理解物理世界的几何关系。结合之前发布的空间智能训练平台SpatialVerse，群核科技要为机器人提供从空间认知到行动交互的训练闭环。机器人也被「卷」到要上学了。

来自主题: AI资讯

11026 点击 2025-03-20 17:34

华为诺亚综述：生成式模型如何用于决策？

近年来，生成模型在内容生成（AIGC）领域蓬勃发展，同时也逐渐引起了在智能决策中的应用关注。

来自主题: AI技术研报

9185 点击 2025-03-20 16:38

AI预判了你的预判！人大高瓴团队发布TTR，教会AI一眼看穿你的下一步

对面有个人向你缓缓抬起手，你会怎么回应呢？握手，还是挥手致意？

来自主题: AI技术研报

6848 点击 2025-03-20 16:26

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

11856 点击 2025-03-20 09:48