AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
一张图生成高质量广视野3D场景,还可控制摄像轨迹

一张图生成高质量广视野3D场景,还可控制摄像轨迹

一张图生成高质量广视野3D场景,还可控制摄像轨迹

只需一张图,就能生成高质量、广范围的3D场景! 泰迪熊、花园、山谷都从平面图片变成了仿佛触手可及的立体物品。

来自主题: AI技术研报
6636 点击    2024-12-30 19:13
稚晖君开源百万机器人真机数据集

稚晖君开源百万机器人真机数据集

稚晖君开源百万机器人真机数据集

百万真机数据集开源项目AgiBot World,也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。 该项目由稚晖君具身智能创业项目智元机器人,携手上海AI Lab、国家地方共建人形机器人创新中心以及上海库帕思联合发布。

来自主题: AI资讯
8196 点击    2024-12-30 11:52
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。

来自主题: AI技术研报
6457 点击    2024-12-28 11:41
轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

控制无人机执行敏捷、高机动性的行为是一项颇具挑战的任务。传统的控制方法,比如 PID 控制器和模型预测控制(MPC),在灵活性和效果上往往有所局限。而近年来,强化学习(RL)在机器人控制领域展现出了巨大的潜力。通过直接将观测映射为动作,强化学习能够减少对系统动力学模型的依赖。

来自主题: AI技术研报
3965 点击    2024-12-28 11:35
清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

目前关于 RLHF 的 scaling(扩展)潜力研究仍然相对缺乏,尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。 针对这一问题,来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究,并提出了优化策略。

来自主题: AI技术研报
8701 点击    2024-12-24 14:56
LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。

来自主题: AI资讯
7147 点击    2024-12-23 15:58
年度特刊|李飞飞的2024年

年度特刊|李飞飞的2024年

年度特刊|李飞飞的2024年

2024年的李飞飞是斯坦福大学的计算机科学教授,是斯坦福以人为本人工智能研究院(HAI)的院长,也是AI创业公司World Labs的创始人。

来自主题: AI资讯
7890 点击    2024-12-22 11:07
重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

近期,新加坡国立大学计算机学院的邵林团队提出了 D(R,O) Grasp:一种面向跨智能体灵巧抓取的机器人与物体交互统一表示。该方法通过创新性地建模机器人手与物体在抓取姿态下的交互关系,成功实现了对多种机器人手型与物体几何形状的高度泛化能力,为灵巧抓取技术的未来开辟了全新的方向。

来自主题: AI技术研报
7680 点击    2024-12-21 11:21
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。

来自主题: AI资讯
7006 点击    2024-12-20 16:14
深度|AI 搜索把 SEO 流量截胡了吗?这家公司希望成为 GenAI 时代的 Semrush!平台用户已超五位数

深度|AI 搜索把 SEO 流量截胡了吗?这家公司希望成为 GenAI 时代的 Semrush!平台用户已超五位数

深度|AI 搜索把 SEO 流量截胡了吗?这家公司希望成为 GenAI 时代的 Semrush!平台用户已超五位数

传统搜索引擎主要基于关键词匹配,通过爬虫爬取网页上的内容并建立索引库,随后根据用户输入的关键词,搜索引擎根据相关性从索引库中返回一排结果展示给用户。

来自主题: AI资讯
7269 点击    2024-12-19 16:17