北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作机器人操纵的一个基本目标是使模型能够理解视觉场景并执行动作。
机器人操纵的一个基本目标是使模型能够理解视觉场景并执行动作。
稚晖君创立智元机器人,资本竞相投资。
本周,CVPR 2024正在美国西雅图拉开序幕。今年CVPR论文投稿数再次创下新纪录,可想而知本届会议的火热。
排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!
人形机器人的「Hello World」。
近年来,具身智能(如自动驾驶和机器人等自主智能体)取得了迅猛发展。
6 月 6 日下午,在上海市浦东新区科技和经济委员会指导下,由上海市浦东新区投资促进中心、人形机器人(上海)有限公司主办,上海浦东科技创业中心、机器之心(上海)科技有限公司承办,中国银行股份有限公司上海市分行协办的「AI + 人形机器人」论坛暨张江机器人全球生态峰会具身智能开发者论坛在浦东新区张江科学会堂成功举行。
马斯克部下跳槽,把人形机器人技术开源了。不少创业公司的估值,一夜被打了骨折。
图像与视频合成、3D 视觉、人体行为识别、视觉与语言推理等研究方向论文最多,属于最热门的方向,体现当前学界对视觉生成、三维感知、人机交互等方向的高度重视。另外,多模态学习、以人为本的设计和自适应机器人可能构成人形机器人的未来。
检索增强生成 (RAG) 是将检索模型与生成模型结合起来,以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG,包括 Langchain 和 LlamaIndex。