一种基于深度学习的教学语料库构建方法、系统及介质

申请号：CN202510719582

申请日期：2025-05-30

公开号：CN120508666A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种基于深度学习的教学语料库构建方法、系统及介质，属于医学教育、人工智能及多模态数据处理的交叉技术领域。方法包括数据采集与标注阶段，中采集不同场景的医学问诊视频数据；模型训练阶段，使用多模态深度学习模型架构对多模态数据进行跨模态对齐；然后基于微调后的预训练语言模型进行语义理解和问题分类；语料库构建与优化阶段，整合多模态数据，搭建语料库管理系统，并对语料库进行动态更新和自适应优化，同时针对地域文化背景构建典型非语言姿势库，结合语料库进行教学。本发明结合医学专业知识，通过深度融合自然语言处理、计算机视觉、语音识别及多模态数据融合技术，构建了一个高效、智能化的医学问诊视频教学语料库。

技术关键词

语料库构建方法多模态深度学习语音识别训练深度神经网络模型预训练语言模型管理系统个性化教学视频语音识别模型骨骼关键点语音特征语料库构建系统跨模态计算机可执行指令关系型数据库动态更新图像分析