一种大模型的部署性能增强方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大模型的部署性能增强方法和装置
申请号:CN202510341060
申请日期:2025-03-21
公开号:CN120317362A
公开日期:2025-07-15
类型:发明专利
摘要
本发明提供了一种大模型的部署性能增强方法,可以应用于人工智能技术领域。该方法包括:通过融合随机和认知不确定性动态调整解码采样限制,基于动态调整结果对大模型的生成内容进行准确性和多样性平衡;将生成不确定性作为监督信号,通过检索内容的实时评估和生成内容的有序检索对大模型的检索策略进行动态调整;通过融合认知不确定性和随机不确定性构建全局风险函数,利用全局风险函数对大模型在思维链中的每个推理步骤进行细粒度评估;对大模型的每个智能体的输出不确定性进行量化,对输出不确定性量化结果进行动态加权融合,基于动态加权融合结果对大模型的输出进行选择。本发明还提供了一种大模型的部署性能增强装置、电子设备和存储介质。
技术关键词
检索策略 风险 动态解码 人工智能技术 实体 电子设备 处理器 输出模块 可读存储介质 信号 指令 松弛 存储器 计算机 机制
系统为您推荐了相关专利信息
文本 格式化 数据安全 加权平均法 概念
意图识别方法 文本 计算机可读指令 大语言模型 策略
飞机 轨迹模型 综合评价指标 飞行数据处理技术 列表
风险评估模型 企业经营数据 模拟器 节点特征 量化风险评估
风险控制方法 编码准则 随机森林模型 贝叶斯网络推理 网络节点结构