摘要
本发明提供了一种基于算法模型的演讲文稿生成方法及系统,包括:获取训练时的第一演讲音视频文件,并对第一演讲音视频文件解析,第一图像结果和音频结果;除去第一图像结果的背景,并对得到待检测第一图像结果进行分类,得到文字区、表格区和图片区;根据初始的第一增强权重对分类结果进行增强,得到增强特征,并获取对应的扩写文本,将扩写文本作为第一孪生网络模型输入;对音频结果进行识别,得到演讲人的演讲文本,并将演讲文本作为第一孪生网络模型的第二个输入进行训练,得到训练好的第二扩写网络模型后对测试时的演讲素材,生成演讲文稿;采用本发明能够提高扩写文本有侧重的生成质量。