一种基于混合检索与检索增强生成的小语种专业问答方法
申请号:CN202510480136
申请日期:2025-04-17
公开号:CN120277194A
公开日期:2025-07-08
类型:发明专利
摘要
本发明提供了一种基于混合检索与检索增强生成的小语种专业问答方法,包括S1.构建多语言知识库:根据相关的小语种文档,使用多语言模型,构建向量索引库和术语知识图谱;S2.多层混合检索:通过多层混合检索模块实现跨语言文档召回,多层混合检索模块由关键词检索、语义检索和向量检索构成;S3.生成回答:利用检索增强生成模块,通过适配的多语言模型进行回答生成,在生成阶段引入规则约束解码和动态注意力机制提高回答的专业性和准确性;S4.自适应优化与知识更新:通过用户反馈强化学习模块,基于用户纠错数据优化模型并监督知识库的更新。本发明方法能够基于少量小语种专业资料,实现小语种专业问答,提升了小语种文档召回率、提升了生成质量。
技术关键词
问答方法
术语
多语言
注意力机制
语义
专业
关键词
图谱
索引
模块
光学字符识别
检索策略
解码
动态
纠错
通道
参数
编码
非标准
覆盖率