一种基于算法模型的演讲文稿生成方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于算法模型的演讲文稿生成方法及系统
申请号:CN202411095050
申请日期:2024-08-12
公开号:CN118657121B
公开日期:2024-10-22
类型:发明专利
摘要
本发明提供了一种基于算法模型的演讲文稿生成方法及系统,包括:获取训练时的第一演讲音视频文件,并对第一演讲音视频文件解析,第一图像结果和音频结果;除去第一图像结果的背景,并对得到待检测第一图像结果进行分类,得到文字区、表格区和图片区;根据初始的第一增强权重对分类结果进行增强,得到增强特征,并获取对应的扩写文本,将扩写文本作为第一孪生网络模型输入;对音频结果进行识别,得到演讲人的演讲文本,并将演讲文本作为第一孪生网络模型的第二个输入进行训练,得到训练好的第二扩写网络模型后对测试时的演讲素材,生成演讲文稿;采用本发明能够提高扩写文本有侧重的生成质量。
技术关键词
意图 算法模型 文字特征 音视频 语音识别网络 图片 生成方法 灰度直方图 标签 文本 表格特征 掩膜 语音识别单元 图像识别模型 音频 解析单元 光学字符识别