摘要
本发明公开了一种基于深度学习的教学语料库构建方法、系统及介质,属于医学教育、人工智能及多模态数据处理的交叉技术领域。方法包括数据采集与标注阶段,中采集不同场景的医学问诊视频数据;模型训练阶段,使用多模态深度学习模型架构对多模态数据进行跨模态对齐;然后基于微调后的预训练语言模型进行语义理解和问题分类;语料库构建与优化阶段,整合多模态数据,搭建语料库管理系统,并对语料库进行动态更新和自适应优化,同时针对地域文化背景构建典型非语言姿势库,结合语料库进行教学。本发明结合医学专业知识,通过深度融合自然语言处理、计算机视觉、语音识别及多模态数据融合技术,构建了一个高效、智能化的医学问诊视频教学语料库。