摘要
本发明提供了一种机械臂智能控制方法、装置及电子设备,应用于人工智能领域及计算机视觉领域。该方法包括:获取环境观测图像和环境深度图像;将目标语言令牌序列输入至大语言模型,得到目标物体描述文本和目标任务描述文本;将目标物体描述文本和环境观测图像输入至开放世界环境感知模型,得到目标物体的第一掩码图像;根据第一掩码图像和环境深度图像,得到目标物体的点云图像;将目标物体描述文本、目标任务描述文本和点云图像输入至大语言模型,得到机械臂的位姿估计信息;根据位姿估计信息,控制机械臂对目标物体执行与目标任务描述文本对应的相应操作。