模型压缩方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型压缩方法、装置及电子设备
申请号:CN202510395992
申请日期:2025-03-31
公开号:CN120373370A
公开日期:2025-07-25
类型:发明专利
摘要
本申请公开了一种模型压缩方法、装置及电子设备,属于人工智能领域,用以解决相关技术中模型压缩效果不佳的问题。包括:获取待压缩的神经网络模型中各目标网络层的第一权重矩阵;针对每个目标网络层,根据目标网络层的原始输入数据和第一权重矩阵,对第一权重矩阵中的每个权重参数进行重要性评估,得到评估结果;根据评估结果和预设拆分策略,将第一权重矩阵拆分为重要参数矩阵和非重要参数矩阵;从各目标网络层中的首个目标网络层开始,根据重要参数矩阵和非重要参数矩阵,对待压缩的神经网络模型逐层进行压缩处理,直至全部目标网络层压缩完成,得到压缩后的神经网络模型。
技术关键词
矩阵 神经网络模型 模型压缩方法 参数 计算机可执行指令 数据 误差 电子设备 可读存储介质 策略 处理器 模块 存储器 元素