摘要
本发明公开一种基于大语言模型的构音障碍语音实时转换系统,包括:基于ASR的语音识别模块,采用Whisper ASR模型将构音障碍患者的输入语音转换为初始文本;基于LLM的语义修正模块,集成Qwen2.5‑7B‑Instruct大语言模型,通过双阶段提示工程技术对初始文本进行语义纠错和情感增强;基于TTS的语音合成模块,采用CosyVoice TTS模型将修正后的文本转换为自然语音输出;实时性优化模块,通过动态语音缓冲机制、边缘‑云协同架构及模型量化技术,控制端到端延迟满足实时因子;个性化联邦学习模块,采用LightFed‑Cluster框架结合差分隐私保护,对ASR和LLM模型进行用户自适应微调;本发明实现了语义准确度、语音清晰度、语音自然度、转换时延的大幅改进,更适合构音障碍患者进行辅助与替代性沟通。