面向通用业务场景的人工智能模型安全性自动化评测方法

申请号：CN202411081306

申请日期：2024-08-08

公开号：CN118627059B

公开日期：2024-10-29

类型：发明专利

摘要

本发明公开了一种面向通用业务场景的人工智能模型安全性自动化评测方法，包括S1、用户提交被评测人工智能模型，以及指定训练被评测人工智能模型的原始数据集；S2、在对被评测人工智能模型进行白盒评测时，通过改进FGSM算法对原始数据集中的每个输入样本生成对应的对抗样本,构成对抗数据集；S3、调用被评测人工智能模型的接口对原始数据集进行预测；S4、在黑盒评测时，用户除需选择其他被评测人工智能模型在白盒评测过程中生成的对抗数据集外，其余过程均和白盒评测时一致；S5、最终得到对被评测人工智能模型的评测得分集合；S6、得到被评测人工智能模型的最终评分。本发明能够全面反映模型在不同攻击场景下的性能，提供客观和准确的评测结果。

技术关键词

人工智能模型评测方法样本白盒场景算法数据标签因子接口策略代表参数符号格式元素动态