摘要
本发明公开了一种智能驾驶数据挖掘方法、装置、设备及存储介质,涉及智能驾驶技术领域,包括:基于多模态大模型架构,引入智能驾驶相关文本数据,对文本语义一致性、图文跨模态匹配和场景逻辑推理进行训练后,部署大模型向量服务;获取场景相关的智能驾驶数据集,调用大模型向量服务,将智能驾驶数据集转化为对应模态的特征向量以存储到向量数据库;调用大模型向量服务,对用户查询信息进行多模态识别,转化为与向量数据库可比对的查询向量;根据查询向量的模态类型,基于向量数据库计算对应的相似度,返回相似度得分最高的多个结果的存储路径。本申请能精准理解复杂的场景检索需求,可从多模态数据中挖掘出符合模型训练要求的多种场景数据。