摘要
本申请公开了一种基于共同最优性的图片‑文本匹配方法,属于图文匹配技术领域。该方法包括:获取目标文本,计算目标文本与标准文本集的距离,得到目标文本距离的概率分布,标准文本集包括多个标准文本,每个标准文本为目标文本对应场景的参考文本;将目标文本输入到文生图模型中,得到候选图片集,候选图片集包括多张候选图片;计算候选图片集与标准图片集的距离,得到候选图片集中每张候选图片距离的概率分布;计算候选图片集中每张候选图片距离的概率分布与目标文本距离的概率分布之间的KL散度,将KL散度最小的候选图片作为目标文本匹配的目标图片。该方法提升了图文匹配的准确性和效率。