音频到文本的转换方法及装置、电子设备、存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
音频到文本的转换方法及装置、电子设备、存储介质
申请号:
CN202411543709
申请日期:
2024-10-31
公开号:
CN119380719A
公开日期:
2025-01-28
类型:
发明专利
摘要
本公开提供了一种音频到文本的转换方法及装置、电子设备、存储介质,属于语音识别技术领域,该方法包括:对目标音频进行特征提取,得到用于表征目标语音内容的音频特征;基于音频特征的时间序列进行分割处理,得到多个音频段;基于多个音频段生成多个文本段;基于语义模型对多个文本段添加对应的标点符号。本公开提供的音频到文本的转换方法及装置、电子设备、存储介质,能够实现高精度的文本输出。
技术关键词
音频特征
转换方法
文本生成模型
多模态信息融合
电子设备
语音识别技术
可读存储介质
特征提取模块
处理器
序列
语义特征
存储器
计算机