基于词向量的大语言模型输入扰动方法、介质及系统

申请号：CN202510686093

申请日期：2025-05-27

公开号：CN120197715B

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于词向量的大语言模型输入扰动方法、介质及系统，其中方法包括：获取待处理文本数据，并进行预处理，以得到敏感词集合；基于词向量模型对待处理文本数据进行词向量表示，以得到待处理文本数据对应的基准词向量矩阵，并将基准词向量矩阵输入到大语言模型中，以得到相应的基准输出；基于敏感词集合对待处理文本数据进行微调，以生成微调词向量矩阵，并将微调词向量矩阵输入到大语言模型中，以得到相应的微调输出；比对基准输出和微调输出，以确定词向量扰动范围；根据词向量扰动范围对待处理文本数据进行扰动，以得到最终大语言模型输入；从而实现对用户的隐私进行有效保护，同时，降低隐私保护对于大语言模型输出结果的影响。

技术关键词

文本扰动方法大语言模型条件随机场模型基准词向量模型数据矩阵模块分词可读存储介质实体标签程序计算机处理器参数