音频转写方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
音频转写方法和装置
申请号:CN202410813620
申请日期:2024-06-21
公开号:CN118645106A
公开日期:2024-09-13
类型:发明专利
摘要
本公开提供了一种音频转写方法和装置,涉及人工智能技术领域,具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括:接收通过客户端安装的存储服务应用的场景入口上传的音频信息;基于场景入口,确定音频信息的场景类型;对音频信息进行语音识别,得到音频信息对应的文本信息;将文本信息和场景类型对应的提示信息输入至语言模型,得到总结信息,其中,语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的,各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。
技术关键词
场景 文本 音频 样本 客户端 转写方法 入口 语言模型训练方法 预训练模型 大语言模型 指令 转写装置 模型训练装置 语音识别模块 深度学习技术 处理器 人工智能技术 计算机程序产品
系统为您推荐了相关专利信息
梯度热处理方法 应力 变量 分区 性能指标信息
智能分析方法 机器视觉技术 员工 图像识别算法 设备运行状态
在线建模方法 生成三维模型 在线建模系统 数据上传模块 标签
通信系统 文本 发送端 样本 接收端
交易风险预警 预警模型 周期性特征 大数据 文本