大模型交互信息安全过滤方法及装置

申请号：CN202511535744

申请日期：2025-10-27

公开号：CN121009895A

公开日期：2025-11-25

类型：发明专利

摘要

本发明提供了一种大模型交互信息安全过滤方法及装置，该方法包括：接收用户输入的查询信息；将查询信息输入至可配置的多层过滤模块进行过滤处理；若查询信息输入多层过滤模块未触发拦截，则将过滤后的查询信息提交至大语言模型进行推理；大语言模型在推理进程中持续输出流式输出文本，并将持续输出的流式输出文本累加至缓存区；在缓存区中的累加文本满足预设的触发条件时，对缓存区中的累加文本执行敏感内容检查；若检测到累加文本中存在敏感内容，终止大语言模型的推理进程；若未检测到累加文本中存在敏感内容，在推理进程完成后输出完整的回答文本。本发明的方法及装置能够对交互中的敏感信息进行实时、精准地过滤，避免风险信息暴露。

技术关键词

过滤模块信息安全过滤方法文本大语言模型命名实体识别风险预测模型进程分析模块机器学习模型自动机卷积神经网络模型训练语言模型策略概念词典通道参数