一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法
申请号:CN202411456056
申请日期:2024-10-18
公开号:CN119475333A
公开日期:2025-02-18
类型:发明专利
摘要
本发明涉及一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法,包括以下步骤:收集恶意软件数据集;对数据集中恶意软件进行混淆;提取权限和控制流程图中API调用特征;将特征使用BERT预训练模型进行嵌入并结合聚类算法对特征进行过滤;对API调用特征进行编码;搭建深度学习框架,框架里面训练所采用的深度学习模型为模型BERT+Self‑Attention+TextCNN模型;重复多次迭代得到最终的预测效果。本发明使用了代码语义和文本嵌入并结合聚类算法,通过训练改进的预训练模型,能够显著提高混淆恶意软件分类的鲁棒性。
技术关键词
恶意软件数据 Android恶意软件 三元组 恶意软件检测 文本 深度学习模型 Attention机制 权限特征 聚类算法 噪声特征 样本 注意力机制 语义特征 实体 训练集 深度学习框架 全局平均池化 预训练模型