摘要
本发明涉知识库构建领域,特别是一种知识库创建及查询方法。本发明旨在提升知识库系统处理非结构化长文本的效率。采用大语言模型的文本分片和语义向量化或专用文本向量化模型的语义向量化技术、基于经验值的固定长度分片,能够将长文本按语义或文本长度分割成小片段,并生成语义向量,从而准确捕捉查询相关的上下文信息。本发明结合向量搜索与Elasticsearch中的分词功能,自动处理同义词、多义词和复杂的上下文关联问题。此外,通过文档数据库、Elasticsearch分布式处理的支持,系统能够在大数据量下快速定位相关内容,解决传统方法在大规模数据集上查询效率低的问题。