摘要
本申请涉及电子设备领域,具体涉及一种场景感知方法、训练方法、程序产品、介质和电子设备。场景感知方法包括:获取目标场景的多视角图像;对多视角图像进行特征提取,得到多视角图像对应的第一特征图;初始化多个高斯球,并根据多个高斯球的初始属性确定多个高斯球的初始查询向量;将第一特征图和多个初始查询向量输入目标高斯解码器,以通过目标高斯解码器预测出与第一特征图对应的多个高斯球的第一目标属性,第一目标属性包括高斯球的第一预测位置和第一预测语义;根据多个高斯球的第一目标属性,得到目标场景的感知结果,感知结果包括根据第一预测位置和第一预测语义确定的目标场景的空间位置的语义信息。