基于视觉编码器的视线目标位置估计方法及一体机装置

申请号：CN202511144434

申请日期：2025-08-15

公开号：CN121033634A

公开日期：2025-11-28

类型：发明专利

摘要

本申请涉及一种基于视觉编码器的视线目标位置估计方法，属于计算机视觉的技术领域。方法包括：基于视频帧生成对应的图片特征，检测图片特征中目标特征的位置；其中，目标特征包括人脸、人手、挡位、方向盘和手刹；基于场景编码器和凝视目标解码器构建视线估计模型，基于人脸位置对视线估计模型进行训练；利用训练后视线估计模型根据人脸位置生成视线的估计点坐标和坐标是否在图像中的概率值；基于目标特征的位置、视线的估计点坐标和坐标是否在图像中的概率值判断车内人员视线关注位置。采用单场景编码器和轻量化的凝视目标解码器构建视线估计模型，结构简单，计算量小，解决传统多分支方法的复杂性高、计算冗余的问题。

技术关键词

人脸位置场景特征坐标位置估计方法方向盘解码器手刹编码器挡位标记图像视频帧人手图片令牌模型训练模块特征提取模块多层感知机生成场景