一种金融领域知识库构建方法、装置及设备

申请号：CN202511069221

申请日期：2025-07-31

公开号：CN120893542A

公开日期：2025-11-04

类型：发明专利

摘要

本申请公开了一种金融领域知识库构建方法、装置及设备，该方法包括：首先从目标图像中识别出文本区域、表格区域、图像区域；然后利用OCR算法提取文本区域的文本数据，及对利用多模态AI模型提取出图像区域的语义特征和视觉特征以及表格区域对应的第二实体集合和实体类型；再利用两个实体集合的相似度进行幻觉检测，当利用检测结果判断出AI模型幻觉并未触发容错机制时，将两个实体集合进行智能对齐处理，筛选出最优实体匹配对；并对其实体类型进行格式化校验；进而再对文本区域对应的文本数据、图像区域对应的语义特征和视觉特征和校验通过的实体匹配对进行上下文知识关联处理，并利用得到的图结构文档表示对应的结构化知识构建更稳准确的知识库。

技术关键词

实体知识库构建方法容错机制视觉特征语义特征卷积循环神经网络表格人工智能AI模型文本光学字符识别意图识别图像金融格式化多模态数据可读存储介质终端设备处理器校验单元