基于词向量的大语言模型输入扰动方法、介质及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于词向量的大语言模型输入扰动方法、介质及系统
申请号:CN202510686093
申请日期:2025-05-27
公开号:CN120197715B
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于词向量的大语言模型输入扰动方法、介质及系统,其中方法包括:获取待处理文本数据,并进行预处理,以得到敏感词集合;基于词向量模型对待处理文本数据进行词向量表示,以得到待处理文本数据对应的基准词向量矩阵,并将基准词向量矩阵输入到大语言模型中,以得到相应的基准输出;基于敏感词集合对待处理文本数据进行微调,以生成微调词向量矩阵,并将微调词向量矩阵输入到大语言模型中,以得到相应的微调输出;比对基准输出和微调输出,以确定词向量扰动范围;根据词向量扰动范围对待处理文本数据进行扰动,以得到最终大语言模型输入;从而实现对用户的隐私进行有效保护,同时,降低隐私保护对于大语言模型输出结果的影响。
技术关键词
文本 扰动方法 大语言模型 条件随机场模型 基准 词向量模型 数据 矩阵 模块 分词 可读存储介质 实体 标签 程序 计算机 处理器 参数