基于共同最优性的图片-文本匹配方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于共同最优性的图片-文本匹配方法
申请号:CN202510942810
申请日期:2025-07-09
公开号:CN120707895A
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了一种基于共同最优性的图片‑文本匹配方法,属于图文匹配技术领域。该方法包括:获取目标文本,计算目标文本与标准文本集的距离,得到目标文本距离的概率分布,标准文本集包括多个标准文本,每个标准文本为目标文本对应场景的参考文本;将目标文本输入到文生图模型中,得到候选图片集,候选图片集包括多张候选图片;计算候选图片集与标准图片集的距离,得到候选图片集中每张候选图片距离的概率分布;计算候选图片集中每张候选图片距离的概率分布与目标文本距离的概率分布之间的KL散度,将KL散度最小的候选图片作为目标文本匹配的目标图片。该方法提升了图文匹配的准确性和效率。
技术关键词
文本匹配方法 图片 图像生成器 编码器模块 图文匹配技术 非暂态计算机可读存储介质 文本匹配装置 分词 处理器 匹配模块 场景 参数 存储器 电子设备 标记 程序