AI资讯新闻榜单内容搜索-训练

关于机器人数据，强化学习大佬Sergey Levine刚刚写了篇好文章

我们知道，训练大模型本就极具挑战，而随着模型规模的扩大与应用领域的拓展，难度也在不断增加，所需的数据更是海量。大型语言模型（LLM）主要依赖大量文本数据，视觉语言模型（VLM）则需要同时包含文本与图像的数据，而在机器人领域，视觉 - 语言 - 行动模型（VLA）则要求大量真实世界中机器人执行任务的数据。

来自主题: AI资讯

8464 点击 2025-07-22 14:57

机器人高层指挥低层做，“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样，仅凭少量演示，就能稳健适应复杂多变的真实场景？美国东北大学和波士顿动力RAI提出了HEP（Hierarchical Equivariant Policy via Frame Transfer）框架，首创“坐标系转移接口”，让机器人学习更高效、泛化更灵活。

来自主题: AI技术研报

7848 点击 2025-07-22 14:07

行业新突破：行为基础模型可实现高效的人形机器人全身控制

人形机器人作为用于复杂运动控制、人机交互和通用物理智能的多功能平台，正受到前所未有的关注。然而，由于其复杂的动力学、欠驱动和多样化的任务需求，实现高效的人形机器人全身控制 (Whole-Body Control，WBC) 仍然是一项根本性的挑战。

来自主题: AI技术研报

7386 点击 2025-07-22 13:50

突破高分辨率图像推理瓶颈，复旦联合南洋理工提出基于视觉Grounding的多轮强化学习框架MGPO

本文的主要作者来自复旦大学和南洋理工大学 S-Lab，研究方向聚焦于视觉推理与强化学习优化。

来自主题: AI技术研报

9060 点击 2025-07-22 10:21

机器人需求驱动导航新SOTA，成功率提升15%！浙大&vivo联手打造

让机器人像人一样边看边理解，来自浙江大学和vivo人工智能实验室的研究团队带来了新进展。

来自主题: AI技术研报

8886 点击 2025-07-22 10:15

上下文工程究竟该怎么用？试下Claude Code+PocketFlow

最近使用cursor的朋友可能已经遇到了这个问题：打开Cursor，准备使用Claude- sonnet4开始Vibe Coding，却看到了"Model not available"的提示。这不是您的网络问题，而是Cursor对中国地区用户限制了高级模型的访问。对于习惯了AI辅助编程的工程师来说，这简直像是突然失去了得力助手。

来自主题: AI技术研报

8727 点击 2025-07-22 10:14

手术刀式去噪突破LLM能力上限，从头预训练模型下游任务平均提高7.2% | 中科院＆阿里

在噪声污染严重影响预训练数据的质量时，如何能够高效且精细地精炼数据？中科院计算所与阿里Qwen等团队联合提出RefineX，一个通过程序化编辑任务实现大规模、精准预训练数据精炼的新框架。

来自主题: AI技术研报

8181 点击 2025-07-22 10:03

多模态大模型存在「内心预警」，无需训练，就能识别越狱攻击

多模态大模型崛起，安全问题紧随其后近年来，大语言模型（LLMs）的突破式进展，催生了视觉语言大模型（LVLMs）的快速兴起，代表作如 GPT-4V、LLaVA 等。

来自主题: AI技术研报

10306 点击 2025-07-22 09:55

GPT-5两周内发布，内测猛料流出？GPT-6或已开始训练，奥特曼剧透百万GPU

GPT-5要上线的消息，已经传得满天飞了！有说两周内上线的，有说它是一个路由器的。同时还有更多猛料：GPT-6，已经在训练中了。莫非OpenAI那些拒掉3亿天价offer的10个人，真的看到了什么不得了的东西？

来自主题: AI资讯

9295 点击 2025-07-21 20:13

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

天津大学联合清华和卡迪夫大学推出RESCUE系统，把「大脑感知-决策-行动」循环搬进电脑，让数百个虚拟人同时在线逃生：他们能实时看见地形、同伴和出口，自动绕开障碍，年轻人快跑、老人慢走、残疾人蹒跚；系统还能把身体24个部位的碰撞力用颜色实时标出来，帮助设计师提前找出潜在风险区域，也能用来演练地铁火灾、演唱会疏散等公共安全场景。

来自主题: AI技术研报

7978 点击 2025-07-21 16:40