一种基于ARM架构的矩阵计算自适应优化方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于ARM架构的矩阵计算自适应优化方法及系统
申请号:CN202511222018
申请日期:2025-08-29
公开号:CN120744299B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种基于ARM架构的矩阵计算自适应优化方法及系统,包括:对待处理矩阵数据进行预处理;对预处理后的矩阵数据进行局部活跃度计算和热点区域识别,确定矩阵的长尾分布特征;基于矩阵的长尾分布特征和处理器信息中多级缓存容量参数,计算矩阵的最优分块大小范围,生成非对称分块方案;基于非对称分块方案,建立矩阵特征与最优分块参数的映射关系;基于非对称分块方案和映射关系,计算各分块的计算密度和内存访问模式,生成任务调度方案;基于任务调度方案,在处理器上执行矩阵计算,输出最终计算结果。本发明通过识别矩阵的长尾分布特性,实现自适应分块和异构核心调度,提高矩阵计算在ARM上的性能和能效。
技术关键词
矩阵 内存访问模式 任务调度 数据 分布特征 缓存命中率 热点 参数 精度 分块策略 内存访问策略 分布方差 关系 验证规则 能效 误差模型 处理器指令集 OTSU算法