效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决
效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。
实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。
近年来,基于扩散的视频生成模型的最新进展极大地提高了视频编辑的真实感和可控性。然而,文字驱动的视频对象移除添加依然面临巨大挑战:
不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。
给大模型装上「身体」与「同理心」,为现代人在人生旷野中提供「无条件的积极关注」。
觉得大模型消耗的算力过大,英伟达推出的8B模型Orchestrator化身「拼好模」,通过组合工具降本增效,使用30%的预算,在HLE上拿下37.1%的成绩。
白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家
从ChatGPT到DeepSeek,AI正沿着“智能+”的路径进入新一轮浪潮。
随着基础模型的日益成熟,AI领域的研发重心正从“训练更强的模型”转移到“构建更强的系统”。在这个新阶段,适配(Adaptation) 成为了连接通用智能与垂直应用的关键纽带。
今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招:Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交互API(Interactions API)。
OpenAI十周年,那个地表最强的AI,又回来了!刚刚,OpenAI深夜炸场!GPT-5.2震撼发布,全球AI王座再次易主。新一代GPT-5.2「全家桶」直接把谷歌Gemini 3 Pro踩在脚下,专业实力更是堪比人类专家。