摘要
本发明公开了一种适用于深度信息缺失场景下的林果位姿估计方法和系统,属于采摘机器人环境感知领域,其中方法包括:使用训练好的模型对果园的林果图像进行林果位姿估计,模型包括:目标检测网络、特征增强模块和位姿预测头,使用林果图像样本训练模型,目标检测网络从林果图像样本中提取多尺度特征图,并生成目标检测框;特征增强模块从多尺度特征图中提取全局语义Token,结合目标检测框内的目标特征,构建特征序列,从特征序列中提取全局特征;位姿预测头利用全局特征预测目标位姿,训练模型至收敛,得到训练好的模型。本发明在缺乏深度信息情况下提升位姿估计精度,泛化能力强,从而增强采摘机器人在复杂室外果园环境中的作业鲁棒性与可靠性。