摘要
本申请实施例提供了一种生成内容的评估方法、装置、介质、设备及产品,涉及自然语言处理技术领域。该方法包括:确定待评估的目标回答,以及与所述目标回答对应的任务描述信息,所述任务描述信息包括以下至少一项:提示词、用户查询语句以及约束信息;基于所述任务描述信息,利用包含结构化推理机制的评估模型对所述目标回答进行多维度评估,其中,所述结构化推理机制采用多步因果推导路径,使所述评估模型能够确定所述目标回答多个评估维度上的表现;根据所述多维度评估的评估结果,确定所述目标回答的评估思维链和/或评估得分。本申请实施例能够增强评估过程的可解释性与可控性,从而有利于满足实际应用中对高质量、可理解性评估结果的需求。