一种提高RAG技术文本生成内容可解释性的方法及系统
申请号:CN202411815176
申请日期:2024-12-11
公开号:CN119862956A
公开日期:2025-04-22
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,具体公开一种提高RAG技术文本生成内容可解释性的方法及系统,该方法包括:针对RAG技术的检索阶段,根据问题文本关联的每个文档片段与问题文本的语义相似度,确定每个文档片段的归一化权重值;归一化权重值表征文档片段对于生成文本的贡献程度;针对RAG技术的生成阶段,获取生成文本中的每个生成单词在生成过程中所依赖的目标文档片段及目标文档片段对应的注意力权重值;注意力权重值表征生成单词在生成过程中所依赖的目标文档片段的重要程度。本发明通过透明化RAG技术的检索过程与生成过程,并提供文本生成内容清晰、可追溯的解释,能够提升RAG技术在高可信度要求领域的可解释性和透明度。
技术关键词
注意力
Attention机制
语义
可读存储介质
文本生成模型
阶段
电子设备
处理器
计算机
自然语言
模块
透明度
存储器
逻辑