基于视觉编码器的视线目标位置估计方法及一体机装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉编码器的视线目标位置估计方法及一体机装置
申请号:CN202511144434
申请日期:2025-08-15
公开号:CN121033634A
公开日期:2025-11-28
类型:发明专利
摘要
本申请涉及一种基于视觉编码器的视线目标位置估计方法,属于计算机视觉的技术领域。方法包括:基于视频帧生成对应的图片特征,检测图片特征中目标特征的位置;其中,目标特征包括人脸、人手、挡位、方向盘和手刹;基于场景编码器和凝视目标解码器构建视线估计模型,基于人脸位置对视线估计模型进行训练;利用训练后视线估计模型根据人脸位置生成视线的估计点坐标和坐标是否在图像中的概率值;基于目标特征的位置、视线的估计点坐标和坐标是否在图像中的概率值判断车内人员视线关注位置。采用单场景编码器和轻量化的凝视目标解码器构建视线估计模型,结构简单,计算量小,解决传统多分支方法的复杂性高、计算冗余的问题。
技术关键词
人脸位置 场景特征 坐标 位置估计方法 方向盘 解码器 手刹 编码器 挡位 标记 图像 视频帧 人手 图片 令牌 模型训练模块 特征提取模块 多层感知机 生成场景