语音分离方法、系统、车辆及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音分离方法、系统、车辆及存储介质
申请号:CN202411392623
申请日期:2024-09-30
公开号:CN119785814A
公开日期:2025-04-08
类型:发明专利
摘要
本申请提供一种语音分离方法、系统、车辆及存储介质中,通过采集车辆空间内至少一个对象的图像序列和混合语音信号;根据所述图像序列和所述混合语音信号进行语音信号分离,以确定所述车辆控件内每个对象的语音信号。本方案摒弃传统的配置多个语音采集装置进行语音采集保证语音分离准确的方案,通过采集对应的图像序列结合混合语音信号进行多模态语音分离,提升语音分离的准确性,降低语音分离对语音采集设备的依赖性,进而可以减少语音采集装置的配置,降低成本。
技术关键词
语音编码 图像编码 信号 序列 音频采集装置 对象 车辆 控件 图像采集装置 语音采集装置 融合特征 上采样 输出特征 语音采集设备 多模态语音 模块 编码特征 语音特征