摘要
本发明涉及数据处理技术领域,公开了一种多模态数据数字化处理过程监控方法,包括:采集待处理文件并识别文件类型,根据文件类型将待处理文件拆分为若干个待处理片段。提取每一待处理片段进行聚类处理并确定表征数据,获取表征总数据量,确定并联通道的分配比例。采集并联通道中各通道的实时处理速率判断是否对分配比例进行调整。当判定对分配比例进行调整时,确定数据集与历史处理数据集进行比对,根据比对结果确定调整系数对分配比例进行调整,并以调整后的分配比例进行处理。本申请通过对待处理文件的类型识别与拆分,实现对不同类型多模态数据的解析与并行处理,提高了整体处理效率和稳定性。