基于语音识别的数字人驱动方法、设备及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语音识别的数字人驱动方法、设备及系统
申请号:CN202411533753
申请日期:2024-10-31
公开号:CN119049476B
公开日期:2025-03-28
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体涉及一种基于语音识别的数字人驱动方法、设备及系统,该方法包括:获取目标区域的各声源的音频数据;确定属于交互用户的语音的目标独立成分语音;确定相似语音组;根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度,确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差;根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置;利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此,本发明提高了数字人与观众的交互灵活性,保证了观众在交互的过程中的参与感,提高了观众的互动体验感。
技术关键词
声音采集设备 声音传播速度 驱动方法 音频 频率 独立成分分析 序列 有效性 驱动设备 语音识别技术 数据 极值 连线 文本 模块 存储器 分词 线段 处理器
系统为您推荐了相关专利信息
语音 噪音过滤方法 神经网络结构 重构 噪音过滤装置
结构设计参数 测试场景 同步器结构 指标 仿真模型
音视频传输方法 接收端 视频块 画面 信令
音频采集模块 教师 视频 图像采集模块 数据处理模块
初始带宽估计 历史会话 估计方法 计算机可执行指令 视频通话信息