摘要
本发明实施例涉及信息检索技术领域,提供一种文本到动作的检索方法、装置及电子设备,该方法包括:获取待检索的三维人体运动视频、运动位置、所述三维人体运动视频的旋转不变特征向量和旋转特征向量,以及用于检索的描述文本;将所述待检索的三维人体运动视频、运动位置、所述三维人体运动视频的旋转不变特征和旋转特征向量,以及用于检索的描述文本输入至文本到动作检索的语义交互神经网络中,得到文本到运动序列的检索结果。由此,通过将文本和动作序列的多种级别表示对齐相结合,可以有效地将叠加运动与对应的文本对齐,并提高对细微局部运动的敏感度,从而实现了文本和运动序列之间的精确语义对齐,提升了文本到运动序列检索的准确性。