一种个性化数字人的即时生成与实时交互的系统、方法、设备
申请号:CN202511113346
申请日期:2025-08-11
公开号:CN120612407A
公开日期:2025-09-09
类型:发明专利
摘要
本申请提供了一种个性化数字人的即时生成与实时交互的系统、方法、设备,属于人工智能技术领域。本申请旨在解决个性化数字人生成与交互脱节、制作周期长、成本高的问题。该方法通过采集用户的音视频数据,经预处理后,利用预训练生成模型即时生成与用户对应的数字人模型及交互界面,并响应用户指令驱动模型进行实时语音和动作反馈。本申请将生成与交互无缝整合,实现了低成本、高效率的个性化数字人应用,提供了高度个性化和沉浸式的用户体验。
技术关键词
音视频
序列
神经网络模型
多任务损失函数
音频
指令
语音识别单元
意图
重构
界面
文本
人工智能技术
实时语音
数据采集模块
语义
存储器