一种基于符号执行轨迹的代码中间表示预训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于符号执行轨迹的代码中间表示预训练方法
申请号:CN202510448019
申请日期:2025-04-10
公开号:CN120295638A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于符号执行轨迹的代码中间表示预训练方法,可以将代码中的控制流展开为符号执行轨迹,在代码中间表示的执行局部提供语义监督信号。本发明通过在控制流图上随机游走将函数展开为符号执行轨迹,限制回边访问次数以避免重复访问循环,并使用符号约束表示控制流转移条件。然后,本发明通过编译优化和代码混淆技术生成语义等价但表示不一致的符号执行轨迹变体,使用对比学习任务学习符号执行轨迹之间的语义等价性。该预训练方法能使代码预训练模型对局部语义的变动有更好的稳健性。
技术关键词
预训练方法 轨迹 图上随机游走 代码混淆技术 符号 语义 预训练系统 神经网络训练 计算机设备 三元组 可读存储介质 预训练模型 标签 指令 处理器 存储器 模块 内存