基于实体社区关系的文字图表多模文档处理及搜索增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于实体社区关系的文字图表多模文档处理及搜索增强方法
申请号:CN202411829165
申请日期:2024-12-12
公开号:CN119782561A
公开日期:2025-04-08
类型:发明专利
摘要
本发明公开了一种基于实体社区关系的文字图表多模文档处理及搜索增强方法,其特征在于,包括以下步骤:用户上传包含文字和图像的文档;对文档进行预处理;文本处理;使用视觉语言大模型判断每个图像的类型;图像处理;知识图谱构建与集成;层次聚类;查询关键词抽取;关键词匹配;检索增强的答案生成。本发明结合了多模态数据(如图像、视频)理解能力和基于知识图谱的搜索增强技术,实现对实体社区关系的多模文档高效处理及搜索功能的显著增强。
技术关键词
图表 文本 知识图谱构建 查询关键词 实体关系抽取 图像处理 摘要 解析工具 格式 聚类 答案 分析单元 视觉 元素 邻居