摘要
本申请提供一种扩散模型的量化方法及系统,其中,方法,包括:获取预训练的扩散模型的校准数据;根据预训练的扩散模型的校准数据,对预训练的扩散模型的激活通道进行重排序,确定预训练的扩散模型的量化层参数;依次固定激活值参数和权重参数,最小化权重参数和激活值参数的乘积误差,确定预训练的扩散模型的量化器参数;将量化层参数和量化器参数交替迭代至预设次数,确定最优的量化层参数和最优的量化器参数;根据最优的量化层参数和最优的量化器参数对预训练的扩散模型进行量化处理,确定经过量化的扩散模型。通过本申请,有效减少激活的离群值现象,降低量化误差,还能够提高量化器参数精度,并有效降低量化配置的比特数。