一种跨语言代码程序分类、分类模型训练方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种跨语言代码程序分类、分类模型训练方法及装置
申请号:CN202411472937
申请日期:2024-10-22
公开号:CN118981335B
公开日期:2024-12-20
类型:发明专利
摘要
本发明公开了一种跨语言代码程序分类、分类模型训练方法及装置,该训练方法包括以下步骤:获取代码片段对集,所述代码片段对集包括第一代码片段对和第二代码片段对;将所述代码片段对集中的所有代码片段解析为抽象语法树结构并根据所述抽象语法树结构得到该代码片段的图结构特征向量;将所述代码片段对集中的所有代码片段转化为token特征向量;对代码片段的token特征向量及其对应的图结构特征向量进行融合,得到融合特征向量;将所述第一代码片段对和第二代码片段对对应的融合特征向量输入分类模型中进行训练。其可提高跨语言代码相似性分类的准确性。
技术关键词
分类模型训练方法 抽象语法树 程序分类方法 节点 标签 列表 预训练模型 语法结构 存储器 控制器 分类装置 序列 格式化 标识符 标记 定义 语句 关系
系统为您推荐了相关专利信息
矢量调节机构 路径规划方法 树形存储结构 节点 模式搜索方法
动态知识图谱 路线生成方法 实体 动态更新 设备组件
社交互动方法 智能驾驶系统 社交互动系统 标签 车辆
管理报文 边缘路由器 媒体访问控制地址 带标签 传输路径
地图 生成道路 光学传感器系统 卫星成像系统 数据