一种基于多维度剪枝的多模态推理模型加速方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多维度剪枝的多模态推理模型加速方法
申请号:CN202510271349
申请日期:2025-03-08
公开号:CN120180364A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种基于多维度剪枝的多模态推理模型加速方法,首先采用元路由器,基于简单高效的自注意力模型,用于自适应地组织剪枝工作流;然后考虑到传统的基于规则的令牌选择方法仅能提供有限的参考,引入了高斯噪声来扩展搜索空间;最后不依赖人工或自动化标注,利用模型输出的变化情况作为自监督信号动态优化元路由器。使用本发明的方法所加速的多模态推理模型在八个基准测试上达到了与最先进模型相当的性能,实现了模型的有效加速。
技术关键词
令牌 路由器 计算机存储介质 存储计算机程序 扩展搜索空间 计算机程序产品 视觉 处理器 文本 注意力模型 多模态 模型压缩 多层感知机 存储器 样本 注意力机制 序列 依赖人工 电子设备 工作流