摘要
本发明提供了一种大模型的部署性能增强方法,可以应用于人工智能技术领域。该方法包括:通过融合随机和认知不确定性动态调整解码采样限制,基于动态调整结果对大模型的生成内容进行准确性和多样性平衡;将生成不确定性作为监督信号,通过检索内容的实时评估和生成内容的有序检索对大模型的检索策略进行动态调整;通过融合认知不确定性和随机不确定性构建全局风险函数,利用全局风险函数对大模型在思维链中的每个推理步骤进行细粒度评估;对大模型的每个智能体的输出不确定性进行量化,对输出不确定性量化结果进行动态加权融合,基于动态加权融合结果对大模型的输出进行选择。本发明还提供了一种大模型的部署性能增强装置、电子设备和存储介质。