代码处理方法、训练数据的处理方法及模型微调方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
代码处理方法、训练数据的处理方法及模型微调方法
申请号:CN202411075167
申请日期:2024-08-06
公开号:CN118860412A
公开日期:2024-10-29
类型:发明专利
摘要
本说明书提供代码处理方法、训练数据的处理方法及模型微调方法,代码处理方法包括:提取待处理代码的图数据,其中,所述图数据包括多个节点和不同节点之间的连接关系;根据所述待处理代码内与所述图数据中至少一个节点对应的代码片段,分别提取所述图数据中至少一个节点的特征;根据所述图数据中至少一节点的特征,以及至少两个节点之间的连接关系,确定所述图数据对应的词向量,其中,所述词向量为适应于大语言模型的特征空间的词向量。该方法能够将代码处理为适应于大语言模型的特征空间的等效词向量,从而使得代码能够接入大语言模型,并提高大语言模型对代码含义的获知能力。
技术关键词
神经网络模型 节点 微调方法 样本 大语言模型 微调装置 关系 标记 标签 抽象语法树 处理器 指令 计算机程序产品 数据模块 可读存储介质 电子设备 漏洞