一种在线辅助语音对话场景的多模态情感提示方法及系统

申请号：CN202510073682

申请日期：2025-01-17

公开号：CN119479705B

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种在线辅助语音对话场景的多模态情感提示方法及系统，涉及人工智能技术领域，将语音对话场景中的语音信号输入到训练好的多模态情感提示大模型中，输出情感标签及语音情感提示信息；多模态情感提示大模型的训练过程如下：获取真实对话场景的原始语音数据以构建情感识别的训练数据集；对训练数据集中的原始语音数据进行特征提取，得到原始语音特征向量；将原始语音特征向量输入到稀疏桥接Transformer模块中，输出融合特征；将融合特征输入到大语言模型中，通过文本解码生成连贯的语音情感提示信息，并关联对应的情感标签；该多模态情感提示方法及系统，实现了对在线辅助语音对话场景下语音情感的精准分析与提示。

技术关键词

提示方法融合特征交叉注意力机制标签场景语音特征提取数据文本在线多模态情感类别训练语音模型大语言模型生成语音情感分类模型语音活动检测矩阵模块

系统为您推荐了相关专利信息

通信方法及装置、存储介质及电子设备

人工智能模型接入网无线智能管理通信方法节点

一种基于路径权重模型的目标路径确定方法和装置

权重模型车辆行驶参数信号灯十字交叉路口行驶车辆

基于共性痕迹挖掘的人工智能合成图像反取证方法

白盒检测器取证方法图像高通滤波器

资源调度管理方法、装置、设备及存储介质

调度管理方法资源分配信息状态机模型容器资源调度管理技术

一种多源视频数据机器人技能学习方法及系统

摄像机策略网络模型控制策略视频运动