摘要
本发明涉及一种基于交叉注意力机制的驾驶员意图识别方法,涉及计算机视觉、图像处理、人机交互等技术领域。对舱内驾驶员的图像数据使用3DResnet‑50模块进行特征提取,得到其特征向量,对舱外环境数据使用光流图像的处理,以及使用一种基于ConvLSTM的编码器‑解码器方式训练的网络进行运动预测和特征提取,由于其固有的卷积能力,该结构能够解决时空序列预测问题。对于提取出的舱内和舱外的两部分特征,输入Transformer注意力模块Encoder中实现交叉注意力特征融合,最后经过FC层实现5种类别(直行、左转、右转、左变道、右变道)的概率预测。本发明将车舱内外的特征先提取再关联,使用交叉注意力机制实现特征融合,增加了意图识别预测的准确度。