音频转写方法和装置

申请号：CN202410813620

申请日期：2024-06-21

公开号：CN118645106A

公开日期：2024-09-13

类型：发明专利

摘要

本公开提供了一种音频转写方法和装置，涉及人工智能技术领域，具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括：接收通过客户端安装的存储服务应用的场景入口上传的音频信息；基于场景入口，确定音频信息的场景类型；对音频信息进行语音识别，得到音频信息对应的文本信息；将文本信息和场景类型对应的提示信息输入至语言模型，得到总结信息，其中，语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的，各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。

技术关键词

场景文本音频样本客户端转写方法入口语言模型训练方法预训练模型大语言模型指令转写装置模型训练装置语音识别模块深度学习技术处理器人工智能技术计算机程序产品

系统为您推荐了相关专利信息

基于应力云图的截齿齿体梯度热处理方法及系统

梯度热处理方法应力变量分区性能指标信息

基于工业场景异常行为检测与智能分析方法

智能分析方法机器视觉技术员工图像识别算法设备运行状态

一种基于Cesium三维引擎的纬地数据在线建模方法及系统

在线建模方法生成三维模型在线建模系统数据上传模块标签

基于零样本学习的语义通信系统

通信系统文本发送端样本接收端

基于大数据与周期函数的交易风险预警方法及系统

交易风险预警预警模型周期性特征大数据文本