摘要
本发明涉及一种基于信息熵的人工智能劝说任务性能评估方法,属于人工智能劝说领域,包括获取劝说任务的样本数据,并对数据进行预处理;任务流程数据集构建;AI对人类用户的不确定性评估;AI对子任务的不确定性评估;劝说任务中AI性能的评估方法;劝说任务AI性能评估模型的设计与实现;通过整合信息熵和全概率公式,基于不确定视角构建了劝说任务中AI性能的评估模型,在信息熵的计量基础上,利用全概率公式设计了劝说任务中AI性能的评估方法,弥补了现有评估方法严重依赖标注数据集,并且缺少对AI性能不确定性关注的局限性的问题;适用于大预言模型、生产式AI在劝说任务中的大规模推广,助力AI真正大规模的落地应用。