一种基于算法模型的演讲文稿生成方法及系统

申请号：CN202411095050

申请日期：2024-08-12

公开号：CN118657121B

公开日期：2024-10-22

类型：发明专利

摘要

本发明提供了一种基于算法模型的演讲文稿生成方法及系统，包括：获取训练时的第一演讲音视频文件，并对第一演讲音视频文件解析，第一图像结果和音频结果；除去第一图像结果的背景，并对得到待检测第一图像结果进行分类，得到文字区、表格区和图片区；根据初始的第一增强权重对分类结果进行增强，得到增强特征，并获取对应的扩写文本，将扩写文本作为第一孪生网络模型输入；对音频结果进行识别，得到演讲人的演讲文本，并将演讲文本作为第一孪生网络模型的第二个输入进行训练，得到训练好的第二扩写网络模型后对测试时的演讲素材，生成演讲文稿；采用本发明能够提高扩写文本有侧重的生成质量。

技术关键词

意图算法模型文字特征音视频语音识别网络图片生成方法灰度直方图标签文本表格特征掩膜语音识别单元图像识别模型音频解析单元光学字符识别