摘要
本申请实施例公开了一种智能座舱大模型的自动化测试方法及系统,其中方法包括:上传待测试用例文档,并根据所述待测试用例文档生成测试输入信号;接收所述测试输入信号,并针对所述测试输入信号执行测试任务,生成测试响应结果;采集测试响应结果,所述测试响应结果包括语音识别结果、人机交互界面截图和系统运行日志;通过裁判大模型对所述测试响应结果进行语义对比和评分,并输出所述测试响应结果对应的相关指标;根据所述测试响应结果对应的相关指标生成测试结果评估报告,并根据所述测试结果评估报告中未达标的测试用例输出典型错误案例列表。本申请有助于提升智能座舱模型测试的准确率、效率与复现性。