摘要
本发明提供了一种大模型交互信息安全过滤方法及装置,该方法包括:接收用户输入的查询信息;将查询信息输入至可配置的多层过滤模块进行过滤处理;若查询信息输入多层过滤模块未触发拦截,则将过滤后的查询信息提交至大语言模型进行推理;大语言模型在推理进程中持续输出流式输出文本,并将持续输出的流式输出文本累加至缓存区;在缓存区中的累加文本满足预设的触发条件时,对缓存区中的累加文本执行敏感内容检查;若检测到累加文本中存在敏感内容,终止大语言模型的推理进程;若未检测到累加文本中存在敏感内容,在推理进程完成后输出完整的回答文本。本发明的方法及装置能够对交互中的敏感信息进行实时、精准地过滤,避免风险信息暴露。