强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍
强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。
搜索
虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。
保持乐观,但变革可能没有想象中的快。
随着传统的人工智能基准测试技术显得力不从心,AI 构建者正转向更具创意的方法来评估生成式 AI 模型的能力。
日前,北京市教委出台《北京市推进中小学人工智能教育工作方案(2025—2027年)》(简称《方案》),计划从今年起,通过创新培育“京娃”系列智能体、全覆盖开展中小学人工智能通识教育、打造一批“助教、助学、助育、助评、助研、助管”应用场景等系列举措,全方位推动人工智能赋能首都基础教育改革发展。
3月18日,美国哥伦比亚特区巡回上诉法院就科学家Stephen Thaler(史蒂芬·泰勒博士,下称泰勒)诉Shira Perlmutter(美国版权局注册官及美国版权办公室主任)以及美国版权局作出标志性判决,认定所有受版权保护的作品必须首先由人类创作。尽管AI技术的发展使得非人类创作的作品越来越多,但根据现有的法律框架,这些作品无法获得版权保护。
中国科学院大学团队在这篇论文中,提出了一个崭新观点:智能体不但是AI领域的核心,更可能是构成宇宙的基本单元,或许还将引发21世纪科学范式的重大变革!
3月20日,国家儿童医学中心、首都医科大学附属北京儿童医院(以下简称“北京儿童医院”)联合北京百川智能科技有限公司(以下简称“百川智能”)、小儿方健康科技(北京)有限公司(以下简称“小儿方”)正式发布国内首个儿科大模型——“福棠·百川”儿科大模型,同时发布两款人工智能应用即AI儿科医生基层版和专家版。
近日,Roblox 发布了一个用于 3D 智能的基础模型 Cude。据介绍,Roblox 的目标是构建一个可以生成 Roblox 游戏各方面体验的 3D 智能基础模型,从生成 3D 物体和场景到人物角色,再到描述事物行为的编程脚本。
硅星人独家获悉,2025年3月20日,物理人工智能领域创业公司松应科技完成天使轮融资,本轮领投机构为中科创星,上海天使会、接力天使、奇绩创坛跟投。关于本轮融资目的,硅星人了解到,松应科技作为快速兴起的物理AI领域初创公司,本次融资资金主要用于产品研发,扩充团队和开发者生态构建。
AI Agents(智能体)也有自己的“摩尔定律”了?!就在最近,Nature报道了一项来自非营利研究机构METR的最新发现:AI在完成长期任务方面的进步速度惊人,其时间跨度大约每七个月翻一番。