一种基于计算共享的深度学习推理加速方法

申请号：CN202510614193

申请日期：2025-05-13

公开号：CN120653426A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于人工智能技术领域，具体公开了一种基于计算共享的深度学习推理加速方法。本发明基于动态计算共享的技术架构，主要从计算任务细粒度分解与共性子图抽取，构建共享隐变量驱动的计算共享分层缓存，计算共享负载进行均衡调度以及计算共享策略的闭环预测反馈机制等，对深度学习模型进行优化，提高计算子图和算子级的复用能力、前向推理权重的缓存命中率，并支持动态子图划分与迁移，从而提高了典型模型的加速比和资源利用率。结合并行计算、动态资源调度和计算资源共享机制，优化异构计算环境下的推理效率。

技术关键词

深度学习模型模拟退火优化算法混合调度策略异构计算环境资源共享机制缓存替换策略动态资源调度感知探针多场景缓存命中率变量多任务人工智能技术指纹节点拉普拉斯索引表矩阵

系统为您推荐了相关专利信息

一种基于跨模态数据的多业务承载教学视频分析方法及系统

跨模态数据知识点视频分析方法知识图谱构建数据采集模块

一种点击操作响应时间计算方法、装置、设备及存储介质

语义分割网络时间计算方法标志物深度学习模型序列

一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法

恶意软件数据 Android恶意软件三元组恶意软件检测文本

液晶计算调制器、计算型液晶光谱成像仪及其数据重建方法

光谱成像仪数据重建方法调制器透过率深度学习模型

一种用于纳米直线电机的耐久测试系统及测试方法

纳米直线电机耐久测试系统 CAN总线通信模块嵌入式系统激光测距系统