摘要
多模态大模型的偏见风险评估方法及系统,方法包括以下步骤:构建偏见词库和偏见图像库;将电力公司在客服沟通过程中的实际输出文本与偏见词库中的基准向量进行比较,生成实际输出文本的偏见风险值并识别偏见文本;计算实际输出图像与图像模板的图像刻板印象相似度,识别偏见图像;计算实际输出文本与实际输出图像的跨模态敏感性评分,识别隐性偏见;基于多模态大模型对文本和图像输出的注意力权重,计算图文偏置值识别模型的异常层,确定隐性偏见来源;计算综合偏见风险评分,划分多个图文偏见风险等级。本发明的偏见风险评估提升了对复杂交互场景中潜藏偏见的可解释分析能力,从而实时监测电力客服语言与推荐图像中的潜在偏见风险。