一种基于LLM和多数据库的实体提取、存储、检索方法
申请号:CN202510822308
申请日期:2025-06-19
公开号:CN120316265A
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及一种基于LLM和多数据库的实体提取、存储、检索方法,基于LLM构造prompt从待存储数据集中提取实体信息,基于实体信息生成实体ID,在数据存储过程中将实体属性和关系分别写入全文库和图数据库并通过实体ID绑定,提高了实体提取的效率,减少了单类别数据库存储海量数据的性能压力。分类后同步写入全文库和图数据库,将实体属性条目写入全文库并与先前写入全文库的实体ID绑定,将实体关系写入图数据库并与先前写入图数据库的实体ID绑定。通过统一检索入口提供数据检索服务,用户无需增加学习成本,自动判断搜索场景查询目标数据库,充分发挥各数据库性能优势,进一步提升了海量数据存储及检索的效率。
技术关键词
检索方法
文库
节点
关键词
倒排索引机制
标识符
实体关系数据
字段
键值
HTTP请求
标签
全文索引
搜索场景
数据存储
列表
散列算法
条目