摘要
一种基于频域先验的人体光流估计方法,包括:S1、构建预训练数据集,采用三维渲染的方式获取三维形状与二维图像之间的对应关系;S2、计算二维图像中每个像素对应的三维点云的频域特征;S3、构建包括图像特征提取器和光流估计器的深度神经网络,基于对应关系和频域特征,利用形状配准的约束条件,对网络实现基于三维频域先验的无监督预训练;S4、仅加载图像特征提取器的预训练参数,在人体光流估计数据集上采用全监督的方式训练图像特征提取器和光流估计器,得到估计人体运动的深度神经网络模型。本发明将三维几何特征与二维图像特征相结合,采用三维非刚性形状配准作为预训练任务,有效利用三维人体频域特征,提升人体光流估计的准确性。