一种基于计算共享的深度学习推理加速方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于计算共享的深度学习推理加速方法
申请号:
CN202510614193
申请日期:
2025-05-13
公开号:
CN120653426A
公开日期:
2025-09-16
类型:
发明专利
摘要
本发明属于人工智能技术领域,具体公开了一种基于计算共享的深度学习推理加速方法。本发明基于动态计算共享的技术架构,主要从计算任务细粒度分解与共性子图抽取,构建共享隐变量驱动的计算共享分层缓存,计算共享负载进行均衡调度以及计算共享策略的闭环预测反馈机制等,对深度学习模型进行优化,提高计算子图和算子级的复用能力、前向推理权重的缓存命中率,并支持动态子图划分与迁移,从而提高了典型模型的加速比和资源利用率。结合并行计算、动态资源调度和计算资源共享机制,优化异构计算环境下的推理效率。
技术关键词
深度学习模型
模拟退火优化算法
混合调度策略
异构计算环境
资源共享机制
缓存替换策略
动态资源调度
感知探针
多场景
缓存命中率
变量
多任务
人工智能技术
指纹
节点
拉普拉斯
索引表
矩阵
系统为您推荐了相关专利信息
1
一种基于跨模态数据的多业务承载教学视频分析方法及系统
跨模态数据
知识点
视频分析方法
知识图谱构建
数据采集模块
2
一种点击操作响应时间计算方法、装置、设备及存储介质
语义分割网络
时间计算方法
标志物
深度学习模型
序列
3
一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法
恶意软件数据
Android恶意软件
三元组
恶意软件检测
文本
4
液晶计算调制器、计算型液晶光谱成像仪及其数据重建方法
光谱成像仪
数据重建方法
调制器
透过率
深度学习模型
5
一种用于纳米直线电机的耐久测试系统及测试方法
纳米直线电机
耐久测试系统
CAN总线通信模块
嵌入式系统
激光测距系统