基于语义嵌入向量生成模型的代码嵌入方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语义嵌入向量生成模型的代码嵌入方法及相关装置
申请号:CN202511071212
申请日期:2025-07-31
公开号:CN120974501A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于语义嵌入向量生成模型的代码嵌入方法,属于计算机技术领域,包括以下步骤:获取二进制代码块并进行反汇编处理和基于不同粒度的代码结构分析,以得到二进制代码块对应的基本块以及控制流图结构特征;基于二进制代码块对应的基本块以及控制流图结构特征进行汇编指令线性转化和跨指令集语义嵌入转化,以生成跨指令集架构对应的统一二进制代码语义嵌入向量空间;获取已知漏洞样本并进行语义漏洞表征分析和候选漏洞检索定位,以生成候选漏洞代码块集合;对候选漏洞代码块集合进行动态分析验证并识别出对应的漏洞修复状态,以输出对应的二进制漏洞代码块检测报告。本发明能够实现二进制代码的高精度语义嵌入。
技术关键词
二进制漏洞 嵌入方法 机器翻译模型 代码结构 独立语义 代码执行漏洞 自然语言 线性 序列 动态 样本 语义向量空间 条件分支指令 无监督学习 漏洞特征 关系 可读存储介质