摘要
本公开提供了一种基于图文双控的高速道路场景下的图像样本生成方法,涉及自动驾驶、大语言模型、混合专家模型、图像生成等人工智能技术领域。该方法包括:根据高速道路场景下的历史图像样本确定背景图,并在背景图上添加掩码得到掩码添加图;得到与目标道路元素的文本描述对应的文本特征;生成与目标道路元素相关的预设道路元素的参考图对应的图像特征;将文本特征和图像特征通过混合专家模型确定对应的特征权重,并按相应的特征权重进行加权计算,得到综合特征;将综合特征和掩码添加图共同作为输入信息输入预设的扩散模型,得到在掩码添加图中掩码所在位置上添加有目标道路元素的图像的增量图像样本。应用该方法可有效扩增样本数量。