一种基于自动编码器和球谐展开的HRTF重建装置及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于自动编码器和球谐展开的HRTF重建装置及方法
申请号:CN202411668122
申请日期:2024-11-21
公开号:CN119545285A
公开日期:2025-02-28
类型:发明专利
摘要
本发明公开了一种基于自动编码器和球谐展开的HRTF重建装置及方法。其装置包括:变分自动编码器,用于根据耳部图片获得耳廓特征的编码表示;球谐系数展开模块,用于将HRTF使用球谐函数展开成球谐系数;预测模块,用于根据变分自动编码器输出的图片编码表示预测HRTF球谐展开系数;重建模块,用于将预测模块预测的球谐展开系数重建为HRTF幅度,然后根据听者的头部宽度进行HRTF相位的个性化,从而获得完整的HRTF。本发明使用球谐函数对HRTF进行降维表示,降维后能够使模型训练更容易,并且理论上可以使用预测的球谐展开系数得到全空间的HRTF。
技术关键词
变分自动编码器 编码器模块 耳部 图片 球谐函数展开 球谐系数 一维卷积神经网络 深度神经网络模型 输入解码器 重构 频率 网格 数据 样本