摘要
本申请涉及人工智能技术领域,具体涉及一种数字人唤醒和交互方法及计算设备,该方法应用于计算设备,包括:按照预设频次,周期性获取视频帧;在当前视频帧中存在交互人物的情况下,利用视频理解模型进行特征提取,得到目标交互人物的人物特征;基于人物特征确定目标交互人物是否属于目标交互群体;在目标交互人物属于目标交互群体的情况下,基于目标交互人物的物理状态唤醒数字人进行多模态交互,并基于多模态交互结果执行业务处理流程。该方法可以在出现交互人物时,对交互人物进行特征提取,以确定交互人物的人物意图,进而可以主动与交互人物进行多模态交互,以对交互人物提供业务支持,交互人物无需主动发起交互,能够提升使用体验。