基于内容查询和位置查询的人物交互检测方法

申请号：CN202510207309

申请日期：2025-02-25

公开号：CN119693762B

公开日期：2025-08-12

类型：发明专利

摘要

本申请适用于人物交互检测技术领域，提供了一种基于内容查询和位置查询的人物交互检测方法，包括：首先通过主干网络提取图像特征，并用目标检测器DETR检测人和物体实例，然后配对人物与物体实例，提取外观、空间和物体类别语义特征并计算交互性分数，选出交互提议，接着将多模态特征深度融合，生成内容和位置嵌入，传入Transformer解码器进行交叉注意力计算，得到交互特征，最后将交互特征输入分类器，结合置信度分数，输出人物交互三元组的分数。该方法通过深度融合多模态特征和交叉注意力机制，有效提高人物与物体交互的检测精度，能够准确识别复杂场景中的人物交互关系。

技术关键词

交互检测方法交互特征语义特征物体解码器多层感知机交互检测技术序列融合多模态特征分类器代表交互性图像视觉特征三元组交叉注意力机制特征点编码坐标