摘要
本发明提供一种基于文本描述的不可见物体4D人物交互生成方法,包括阶段一,3D人‑物体交互关键帧恢复:通过人体运动模型获取人体运动序列并均匀降采样,提取关键帧;对每个关键帧通过SMPL‑X模型重建人体网格并提取顶点位置,形成人体点云;物体位置锚定网络以人体点云、物体模板点云和文本提示为输入预测物体位置,生成3D人‑物体交互关键帧;阶段二,4D人‑物体交互序列生成:构建接触感知扩散模型,以稀疏的3D人‑物体交互关键帧为输入,通过接触感知编码器提取条件信号;基于条件信号,通过接触感知扩散模型对3D人‑物体交互关键帧进行时序插值,生成时序连贯的稠密4D人‑物体交互序列。本发明实现对未见物体的自然逼真4D人物‑物体交互合成。