一种基于文本描述的不可见物体4D人物交互生成方法

申请号：CN202510565049

申请日期：2025-04-30

公开号：CN120491813A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供一种基于文本描述的不可见物体4D人物交互生成方法，包括阶段一，3D人‑物体交互关键帧恢复：通过人体运动模型获取人体运动序列并均匀降采样，提取关键帧；对每个关键帧通过SMPL‑X模型重建人体网格并提取顶点位置，形成人体点云；物体位置锚定网络以人体点云、物体模板点云和文本提示为输入预测物体位置，生成3D人‑物体交互关键帧；阶段二，4D人‑物体交互序列生成：构建接触感知扩散模型，以稀疏的3D人‑物体交互关键帧为输入，通过接触感知编码器提取条件信号；基于条件信号，通过接触感知扩散模型对3D人‑物体交互关键帧进行时序插值，生成时序连贯的稠密4D人‑物体交互序列。本发明实现对未见物体的自然逼真4D人物‑物体交互合成。

技术关键词

关键帧物体人体运动模型重建人体交互注意力序列生成方法感知特征点云文本时序交叉注意力机制编码器网格计算机存储介质模板处理器信号

系统为您推荐了相关专利信息

基于侧扫声呐与惯性传感器融合的无人艇定位方法、系统及介质

惯性传感器无人艇 ORB特征定位方法侧扫声呐图像

人形机器人多模态环境感知与自适应底盘控制方法

底盘控制方法多模态环境人形机器人深度确定性策略梯度机器人智能控制技术

运载平台协同作业方法、系统、装置及存储介质

运载平台协同作业方法作业平台运动状态信息组合体

一种内容溯源方法及系统

编码生成水印溯源系统溯源方法 RSA算法

泥石流监测方法、系统、设备、存储介质及产品

泥石流监测方法光流特征稠密光流物体轮廓深度学习神经网络