一种基于符号执行轨迹的代码中间表示预训练方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于符号执行轨迹的代码中间表示预训练方法
申请号:
CN202510448019
申请日期:
2025-04-10
公开号:
CN120295638A
公开日期:
2025-07-11
类型:
发明专利
摘要
本发明公开了一种基于符号执行轨迹的代码中间表示预训练方法,可以将代码中的控制流展开为符号执行轨迹,在代码中间表示的执行局部提供语义监督信号。本发明通过在控制流图上随机游走将函数展开为符号执行轨迹,限制回边访问次数以避免重复访问循环,并使用符号约束表示控制流转移条件。然后,本发明通过编译优化和代码混淆技术生成语义等价但表示不一致的符号执行轨迹变体,使用对比学习任务学习符号执行轨迹之间的语义等价性。该预训练方法能使代码预训练模型对局部语义的变动有更好的稳健性。
技术关键词
预训练方法
轨迹
图上随机游走
代码混淆技术
符号
语义
预训练系统
神经网络训练
计算机设备
三元组
可读存储介质
预训练模型
标签
指令
处理器
存储器
模块
内存