摘要
本发明属于人工智能技术领域,涉及一种智能座舱多模态数据构建方法、系统、设备及存储介质,所述方法包括:1)图像生成:基于开源车载摄像视频截取得到多张图像并利用多模态大模型对每张图像进行分类;2)问题生成:将图像和真实问题输入多模态大模型,由多模态大模型依据事先设计的问题角度和事先设计的问题标签体系为每张图像生成对应的问题;3)答案生成:利用多模态大模型对生成的每个问题进行分类并基于图像和问题利用多模态大模型生成对应的答案;4)人工确认:对图像、生成的问题及生成的答案进行人工确认并将通过人工确认的图像、生成的问题及生成的答案组成智能座舱多模态数据。其能够自动化批量生成高质量的多模态VQA标注数据。