摘要
本申请公开了一种场景图构建方法、目标检索方法和相关装置,包括:构建拓扑节点集合和拓扑边集合;对于拓扑节点集合中的每个拓扑节点,将该拓扑节点的视觉信息、文本信息和空间位置信息的集合,作为该拓扑节点的多模态数据;对于拓扑节点集合中的每个拓扑节点,基于该拓扑节点的视觉信息,确定该拓扑节点对应的物体节点的多模态数据和该拓扑节点对应的连接边集合;基于每个拓扑节点的多模态数据、每个物体节点的多模态数据、拓扑边集合和每个拓扑节点对应的连接边集合,构建目标场景图。该目标场景图具备语义一致性与空间连续性,显著提升场景图在复杂环境中的表达能力与跨场景的泛化性能。