摘要
本申请涉及人工智能技术领域,提供了一种模型评测方法、装置和系统,包括根据测试样本和目标扰动场景自动调整测试样本以在测试样本中出现异常,得到目标扰动场景的样本。其中,测试样本为用于对训练后的人工智能AI模型进行测试的数据,目标扰动场景指示在测试样本上出现的异常的特征。还包括根据目标扰动场景的样本对AI模型进行测试,得到AI模型的测试结果作为AI模型在目标扰动场景的测试结果,以及根据AI模型在目标扰动场景的测试结果得到AI模型的评估结果。能够实现对模型进行评测得到的结果能够准确地反映模型的鲁棒性,帮助更好地评测模型和优化模型。