摘要
本发明公开了一种用于事件流的多模态大模型解译方法,解决了多模态大模型对事件流感知解译难的问题,属于计算机视觉领域;包括:将极性事件流数据重构为灰度图像序列;通过Lucas‑Kanade光流算法判断是否需要运动放大,是则进行傅里叶变换、复数可操控金字塔和S变换,并通过带通滤波器去噪,使用双向差分方法结合放大参数进行增强;将增强相位分量特征子带与幅值分量特征子带融合,恢复空间分辨率得到重构频域信号;通过逆傅里叶变换得到运动放大的灰度图像序列,计算归一化互相关参数动态调整放大参数;将运动放大的灰度图像序列输入多模态大模型中输出解译事件描述;本发明实现了多模态大模型对事件流的有效感知和精准解译。