摘要
本发明涉及AI视觉的技术领域,公开了一种基于AI视觉的物品动态场景识别方法及装置,本发明采集动态场景的视频流生成视频帧序列,将视频帧序列输入到由卷积神经网络(CNN)和LSTM网络组成的AI视觉动态识别模型中,进行模型训练,并添加注意力机制和多任务机制,生成最终的优化训练版本,来通过AI视觉实现物品在动态场景中的准确识别,本方案结合CNN和LSTM网络,模型能够有效提取视频流中的时空特征,提升动态物品识别能力,注意力机制能够自动聚焦于视频中的关键区域,提高识别精度,多任务机制使得模型能够同时完成多项任务,如物品检测和动作识别,增强系统的多功能性和适应性,解决了现有技术中难以准确识别动态场景的物品变化的问题。