摘要
本发明涉及代码漏洞检测领域,具体涉及一种基于高维漏洞表征的二进制漏洞检索和定位方法及系统,包括首先输入二进制文件,解析二进制文件结构信息,解析机器指令;提取二进制文件函数信息、生成跨平台基本块IR指令序列、构建控制流图、构建数据依赖图;将程序依赖图特征向量和基本块IR指令序列特征向量拼接起来,进行多模态特征融合生成一个综合的高维漏洞表征向量;最后将高维漏洞表征向量输入索引进行搜索,得到多个最近邻的索引和距离,将距离转换为相似度,根据相似度阈值过滤获取最相似的漏洞向量,根据漏洞向量对应的漏洞信息和漏洞位置。本发明解决了传统二进制漏洞检测跨平台和编译器优化检测失效、结果可靠性低的问题。