一种大模型的部署性能增强方法和装置

申请号：CN202510341060

申请日期：2025-03-21

公开号：CN120317362A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供了一种大模型的部署性能增强方法，可以应用于人工智能技术领域。该方法包括：通过融合随机和认知不确定性动态调整解码采样限制，基于动态调整结果对大模型的生成内容进行准确性和多样性平衡；将生成不确定性作为监督信号，通过检索内容的实时评估和生成内容的有序检索对大模型的检索策略进行动态调整；通过融合认知不确定性和随机不确定性构建全局风险函数，利用全局风险函数对大模型在思维链中的每个推理步骤进行细粒度评估；对大模型的每个智能体的输出不确定性进行量化，对输出不确定性量化结果进行动态加权融合，基于动态加权融合结果对大模型的输出进行选择。本发明还提供了一种大模型的部署性能增强装置、电子设备和存储介质。

技术关键词

检索策略风险动态解码人工智能技术实体电子设备处理器输出模块可读存储介质信号指令松弛存储器计算机机制

系统为您推荐了相关专利信息

一种数据安全合规评估与识别方法及系统

文本格式化数据安全加权平均法概念

意图识别方法、装置、计算机设备及存储介质

意图识别方法文本计算机可读指令大语言模型策略

一种飞行区飞机自动引导的系统及方法

飞机轨迹模型综合评价指标飞行数据处理技术列表

供应链风险评估的方法、装置、设备、存储介质及产品

风险评估模型企业经营数据模拟器节点特征量化风险评估

基于贝叶斯网络的地铁建设工程坍塌事故风险控制方法

风险控制方法编码准则随机森林模型贝叶斯网络推理网络节点结构