摘要
根据本公开的实施例,提供了模型评价方法、装置、设备和存储介质。该方法包括:获取第一代码片段,第一代码片段包括满足嵌套约束的多个函数对象;确定与多个函数对象中的目标函数对象相关联的函数调用的参考结果;向第一模型输入测试信息,测试信息指示第一模型基于测试代码来执行与目标函数对象相关联的函数调用,测试代码包括第一代码片段和至少一个第二代码片段;以及基于第一模型所输出的执行结果与参考结果的比较,生成第一模型的评价信息。基于这样的方式,本公开的实施例可以在第一代码片段中添加至少一个第二代码片段来构成测试代码,增加了测试代码的复杂度,使得测试代码更接近于实际代码环境中的代码,有助于更准确的对第一模型进行评价。