一种基于transformer模型的精度调优方法、系统、设备及存储介质

申请号：CN202411963191

申请日期：2024-12-30

公开号：CN119886346B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开一种基于transformer模型的精度调优方法、系统、设备及存储介质，通过启发式地迭代搜索混合精度策略快速恢复transformer模型的精度，获得与全精度模型精度基本对齐的FP32+FP16混合模型，同时也能够保证推理性能与原始FP16模型接近，该方法是一种基于启发式迭代搜索的混合精度配置方法，用于优化transformer模型的精度和推理性能，在精度调优的同时能够在FP16精度部署上保持与全FP16模型接近的推理性能；通过按层类型选择FP32网络层的启发式策略，以保持模型的精度；结合cos相似度指标和预设相似度阈值的模型精度与性能评估机制，保证精度调优的结果；同时，能够在不同NVIDIA芯片平台上运行，兼容性好。

技术关键词

调优方法精度配置方法输出模块启发式策略无标签样本平台通信接口存储计算机程序存储器处理器数据数值格式指标表达式芯片电子设备

系统为您推荐了相关专利信息

一种室外输电通道巡检智能检测方法、系统和设备

智能检测方法视觉特征文本编码器巡检图像地理信息系统

一种种子漂浮育苗出苗率智能检测系统

种子漂浮育苗智能检测系统幼苗育苗盘图像处理算法

文旅资源多维度智能推荐与动态组合系统

资源组合系统行程兴趣动态

一种聚烯烃熔融指数的预测方法、装置、设备及存储介质

无标签样本半监督学习计算机程序指令指数参数

一种机器人的控制电路及机器人

开关单元控制接口传感器接口控制电路端口