摘要
本发明提供一种用于复杂图文混合文件的方案检测方法及装置,方法包括:提取标准手册中的标准审查条目和标准审查内容并进行结构化处理,获得标准审查文件;将待检测的文件转换为待检测图像,采用OCR、预先训练获得的初始识别模型和匹配模型对待检测图像提取待审查的多尺度候选区域图像,并提取多尺度候选图像的文字信息,获得候选区域文字信息;将多尺度候选区域图像和标准审查文件输入至预先训练获得的轻量级混合孪生网络进行图像特征匹配,输出匹配特征图像;将匹配特征图像、标准审查文件以及候选区域文字信息输入至预先训练获得的多模态大模型进行合规分析,输出检测结果;该方法能够显著提升复杂图文混合文件的审查的自动化与智能化程度。