基于多模实体自动提取、分类和关联的知识库构建方法和存储介质
申请号:CN202510056304
申请日期:2025-01-14
公开号:CN120014327A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供基于多模实体自动提取、分类和关联的知识库构建方法和存储介质,方法涉及预处理文本数据和图像数据,使用双向编码器和随机场模型提取文本实体,通过语句分析算法获取文本语义关系;利用目标检测模型和图像描述算法提取图像实体和语义关系;融合文本和图像实体特征,构建多模态深度学习模型并引入注意力机制;对多模实体进行分类,构建三元组并基于分类结果和三元组构建知识库;对知识库进行质量评估和优化。此方法通过自动化技术提高了知识库构建的效率和准确性,丰富了知识库内容,并通过注意力机制提升了分类效果和知识库质量。
技术关键词
知识库构建方法
多模态深度学习
实体
文本
引入注意力机制
三元组
深度学习模型
数据
计算机可读取存储介质
关系
生成算法
图像特征提取
语义标签
语句
编码器
依存句法分析
物体
表达式