数据与机理融合的工控多模态生成式预训练模型构建方法
申请号:CN202410982683
申请日期:2024-07-22
公开号:CN118940108A
公开日期:2024-11-12
类型:发明专利
摘要
本发明公开了一种数据与机理融合的工控多模态生成式预训练模型构建方法,收集大量工业时序信号,以滑窗切割的方式划分出一定数量的样本,各个样本进行标准化预处理;以机理知识为依据,对各时序样本进行文本描述,进而形成大量的时序信号‑文本对并构建数据集;构建能使信号与文本多模态表示对齐的双编码器,所述双编码器包括信号编码器与文本编码器;构建在“文本+信号‑>信号”范式下的工控多模态生成式预训练模型。在保证文本描述的准确性和全面性的同时,减少文本标注成本。该方法通过表示对齐赋予信号显式的语义,从而支持后续模型中信号数据与文本知识的多模态深层次融合。使得预训练模型具有在下游任务上展现优异性能的潜能。
技术关键词
预训练模型
信号编码器
多模态
文本编码器
信号解码器
双编码器
样本
数据
时序
模版
语句
重构
语义
超参数
工业
数学