针对大模型检索增强生成的文档分块方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
针对大模型检索增强生成的文档分块方法及系统
申请号:CN202510992941
申请日期:2025-07-18
公开号:CN120975089A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种针对大模型检索增强生成的文档分块方法及系统,涉及人工智能技术领域,该方法包括:构建文档分块模型,文档分块模型包括输入层、摘要生成层、分块层和输出层;通过输入层获取目标文档,目标文档包括若干个句子;通过摘要生成层基于摘要生成器为目标文档生成摘要;通过分块层计算目标文档中每个句子与摘要的语义相似度,将语义相似度大于等于相似度阈值的相邻句子分组为相关文本块,将语义相似度小于相似度阈值的相邻句子分组为无关文本块;通过输出层基于相关文本块和无关文本块得到文档的最终分块结果,有助于解决现有技术文档分块效率低且生成质量较差的问题。
技术关键词
文档分块方法 摘要 语义 文本 非暂态计算机可读介质 人工智能技术 处理器 编码 存储器 电子设备