语音识别情绪量化分析及生成技术
概述
1. 构建端到端的情感语音交互模型 2. AI能够根据对话内容、用户情绪以及预设的场景模式,动态地切换自身的情感表达
需求详情
1.  构建端到端的情感语音交互模型:①  实现直接以用户原始语音作为输入,输出带情感的语音回应。提升交互流畅度,生成更自然、富有表现力的情感语音,避免传统级联模型的误差累积。②  输出带有特定情感的语音统一模型架构,声学特征与情感特征的联合学习,引入情感嵌入或情感控制信号。2.  AI能够根据对话内容、用户情绪以及预设的场景模式,动态地切换自身的情感表达:①  场景感知与情感策略 :理解对话主题、用户意图及历史交互信息②  用户情绪跟踪 :持续监测用户语音(及多模态信息)中的情感变化③  预设情感规则/策略库 :针对不同场景,预设AI 的情感表达策略 ④  高精准度情感识别:支持多种情绪(如疲惫、好奇、焦虑)及混合情绪识别,适应个体差异(不同用户的情感表达方式),抗环境噪声干扰(如景区嘈杂环境)。⑤  强化学习:通过与用户的交互不断优化情感切换策略,自动学习特定用户的语音特征和情感偏好。3.  需求内容聚焦于构建高精度多分类语音情感识别+情感推理决策+情绪语音合成+低延迟交互的端到端模型系统,建议有相关应用案例。
征集中
金额:20万元-30万元