摘要
本发明公开了一种基于动态时间规整的增强语音反馈方法、装置、设备及计算机可读存储介质,该方法包括:获取用户动作对应的用户骨骼点序列,并应用运动学动态时间规整算法将用户骨骼点序列与标准动作模板进行比对,以生成表征动作完成度的动作评估分数;基于动作评估分数,确定用户情绪等级;将用户情绪等级和动作评估分数,输入至预训练的语言生成式模型,生成与用户情绪等级相匹配的情感化反馈文本;基于用户情绪等级,确定语音合成参数;训练并生成个性化音色克隆模型;生成具有用户音色且情感表达与用户情绪等级相匹配的增强语音反馈。本发明具有提供情绪化语音增强反馈的优点。