摘要
本发明实施例公开了一种基于自回归扩散变换器的全身人体运动生成系统及方法,所述系统包括自回归扩散变换器、统一人体运动模块及多模态编码器,其中,所述多模态编码器分别提取输入的数据中的各模态特征,并将各模态特征投影至统一的多模态特征空间;所述统一人体运动模块将投影后的多模态特征拼接,形成固定的前缀上下文输入到扩散变换器中;所述扩散变换器生成并输出全身人体运动。本发明解决了生成运动质量不足、场景泛化有限,多模态条件控制不精确以及难以生成长时且具备时空一致性运动的问题。本发明显著提升了生成运动的真实性和可控性,同时支持多样化的运动生成任务。