摘要
本申请实施例提供了一种动作控制方法、动作控制模型的训练方法、装置及设备,涉及人工智能技术领域。该方法包括:从第一视频提取第一视频特征,以及从第一图像提取第一图像特征;根据第一视频特征和第一图像特征,得到初始融合特征;基于频率感知权重,通过扩散神经网络对初始融合特征执行N个阶段的降噪处理,得到最终融合特征,N为正整数;基于最终融合特征,生成包含目标主体的第二视频,目标主体在第二视频中的动作是基于参考主体在第一视频中的动作控制的。扩散神经网络在不同频率下从关注目标主体的空间结构特征转变到关注参考主体的动作特征,以使得得到的最终融合特征中能够包括更多的细节的动作特征。