一种应用于文本转语音的大规模语音克隆模型智能管理方法

申请号：CN202510793996

申请日期：2025-06-13

公开号：CN120743503A

公开日期：2025-10-03

类型：发明专利

摘要

本发明提供一种应用于文本转语音的大规模语音克隆模型智能管理方法，包括：构建多级存储架构，根据用户对语音克隆模型的使用频率、使用时间和模型等级计算语音克隆模型的优先级，根据语音克隆模型的优先级将语音克隆模型分层存储于GPU显存、系统RAM和SSD、以及云存储，基于ARIMA算法分析用户过去一段时间的模型使用习惯，预测未来可能会用到的模型，提前加载模型至GPU显存。本发明方案通过多级分层存储降低GPU显存占用，通过优先级调度和预加载减少GPU加载时间，解决了TTS系统中大规模模型管理的显存占用高和加载延迟长的问题，实现了低成本、高效率、低延迟的模型管理。

技术关键词

语音智能管理方法负载均衡器文本智能管理系统云存储调度器节点哈希算法分层低延迟网关模块高效率显卡动态付费低成本频率