摘要
本申请涉及一种基于视觉编码器的视线目标位置估计方法,属于计算机视觉的技术领域。方法包括:基于视频帧生成对应的图片特征,检测图片特征中目标特征的位置;其中,目标特征包括人脸、人手、挡位、方向盘和手刹;基于场景编码器和凝视目标解码器构建视线估计模型,基于人脸位置对视线估计模型进行训练;利用训练后视线估计模型根据人脸位置生成视线的估计点坐标和坐标是否在图像中的概率值;基于目标特征的位置、视线的估计点坐标和坐标是否在图像中的概率值判断车内人员视线关注位置。采用单场景编码器和轻量化的凝视目标解码器构建视线估计模型,结构简单,计算量小,解决传统多分支方法的复杂性高、计算冗余的问题。