一种基于多级预测的代码克隆检测方法、装置及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多级预测的代码克隆检测方法、装置及介质
申请号:CN202510224206
申请日期:2025-02-27
公开号:CN120122991A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种基于多级预测的代码克隆克隆检测方法、装置及介质,所述方法包括:首先对代码片段进行抽象语法树AST解析并通过遍历生成AST节点编码序列,同时,将代码文本转化为Token序列,通过相似结构的深度学习模型分别从AST节点序列和Token序列中提取特征向量,并基于AST编码序列得到节点类型统计向量,最后进行多级预测:根据得到的代码的抽象语法树特征、文本特征、节点类型特征依次对代码对进行相似性计算,仅当所有级别的预测均确认克隆存在时,才最终判定代码对为克隆对。本发明通过多级预测机制,从多维度分析代码的特征以提高克隆检测的准确性,为代码克隆检测提供了一种高效且可靠的方法。
技术关键词
代码克隆检测方法 双向长短期记忆网络 抽象语法树 文本 节点 词嵌入方法 语义特征提取 深度学习模型 序列 度量 处理器 多阶段 电子装置 存储器 编码 介质 冗余
系统为您推荐了相关专利信息
开采单元 仿真数据 矿山地质 语义特征提取 模型修正方法
报告 芯片 生成方法 唯一性 数据
车辆运输方式 节点 链路 神经网络模型 物流
数据处理系统 分布式架构 负载监测单元 层级 资源配置数据
数据预测方法 注意力机制 时间序列特征 节点 时空上下文信息