摘要
本发明实施例提供一种具身机器人多摄视频融合方法、系统及存储介质,属于图像处理领域。所述方法包括:基于视觉与惯性对齐模型对图像进行时间和空间的对齐,生成统一对齐图像序列;基于所述统一对齐图像序列提取多尺度图像特征,并构建用于引导注意力融合操作的跨视角残差图,以生成融合图像;对所述融合图像执行隐私区域识别,并对隐私区域执行遮挡处理,获得隐私保护图像;对所述隐私保护图像进行语义压缩,并根据网络链路状态信息调整图像帧调度顺序,输出用于控制决策的视频信号。面向具身机器人多摄图像采集过程中的时空对齐、跨视角融合与隐私保护处理,并基于链路状态自适应输出控制用视频信号的全过程优化。