摘要
本发明公开了一种基于多级预测的代码克隆克隆检测方法、装置及介质,所述方法包括:首先对代码片段进行抽象语法树AST解析并通过遍历生成AST节点编码序列,同时,将代码文本转化为Token序列,通过相似结构的深度学习模型分别从AST节点序列和Token序列中提取特征向量,并基于AST编码序列得到节点类型统计向量,最后进行多级预测:根据得到的代码的抽象语法树特征、文本特征、节点类型特征依次对代码对进行相似性计算,仅当所有级别的预测均确认克隆存在时,才最终判定代码对为克隆对。本发明通过多级预测机制,从多维度分析代码的特征以提高克隆检测的准确性,为代码克隆检测提供了一种高效且可靠的方法。