一种基于计算共享的深度学习推理加速方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于计算共享的深度学习推理加速方法
申请号:CN202510614193
申请日期:2025-05-13
公开号:CN120653426A
公开日期:2025-09-16
类型:发明专利
摘要
本发明属于人工智能技术领域,具体公开了一种基于计算共享的深度学习推理加速方法。本发明基于动态计算共享的技术架构,主要从计算任务细粒度分解与共性子图抽取,构建共享隐变量驱动的计算共享分层缓存,计算共享负载进行均衡调度以及计算共享策略的闭环预测反馈机制等,对深度学习模型进行优化,提高计算子图和算子级的复用能力、前向推理权重的缓存命中率,并支持动态子图划分与迁移,从而提高了典型模型的加速比和资源利用率。结合并行计算、动态资源调度和计算资源共享机制,优化异构计算环境下的推理效率。
技术关键词
深度学习模型 模拟退火优化算法 混合调度策略 异构计算环境 资源共享机制 缓存替换策略 动态资源调度 感知探针 多场景 缓存命中率 变量 多任务 人工智能技术 指纹 节点 拉普拉斯 索引表 矩阵
系统为您推荐了相关专利信息
跨模态数据 知识点 视频分析方法 知识图谱构建 数据采集模块
语义分割网络 时间计算方法 标志物 深度学习模型 序列
恶意软件数据 Android恶意软件 三元组 恶意软件检测 文本
光谱成像仪 数据重建方法 调制器 透过率 深度学习模型
纳米直线电机 耐久测试系统 CAN总线通信模块 嵌入式系统 激光测距系统