基于马尔可夫决策过程的大语言模型多阶段隐私保护方法

申请号：CN202510033845

申请日期：2025-01-09

公开号：CN119416268A

公开日期：2025-02-11

类型：发明专利

摘要

本发明属于大模型保护数据的技术领域，更具体地，涉及基于马尔可夫决策过程的大语言模型多阶段隐私保护方法。所述方法包括系统建模，设计基于MDP的动态隐私保护模型MDP‑PPFC。所述模型包括系统状态和状态转换，在系统中引入纳什均衡的功能来分析模型中的收益函数，用户和系统可以找到保护隐私问题的权衡来最大化准确结果；系统分析，获取MoD数据效用测量和分析隐私损失；最优防御策略中的强化学习，修改SARSA强化学习算法以在提出的模型中获得零和多阶段博弈的独占纳什结果。本发明解决了各种局限性导致先前的研究无法全面揭示隐私保护过程中所面临的风险的问题。

技术关键词

隐私保护方法策略多阶段强化学习算法决策消息动态定义系统状态转换概率代表度量数据可读存储介质交互机制采取行动处理器通信设备