一种基于自动适配和动态优化的模型推理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于自动适配和动态优化的模型推理方法及系统
申请号:CN202411002718
申请日期:2024-07-25
公开号:CN118917417A
公开日期:2024-11-08
类型:发明专利
摘要
本发明属于机器学习技术领域,公开了一种基于自动适配和动态优化的模型推理方法及系统。所述方法包括:发送第一请求至硬件配置模块以基于目标通信通道实现目标设备与动态库的交互通信;其中,硬件配置模块包括若干通信通道,通信通道基于设备属性与操作属性和待接入设备一一对应;所述第一请求包括目标设备的设备属性及操作属性;发送第二请求以加载目标驱动插件,进而以实现目标模型在目标设备上的加载;其中,目标驱动插件由目标设备对应的厂商基于预定义的接口规范编写构建;基于资源分配策略为目标模型进行资源配置,并基于多流并行策略及图优化技术进行动态优化以实现目标模型的模型推理。本发明具有设备兼容性强、资源配置更优的技术优势。
技术关键词
资源分配策略 推理方法 并行策略 表达式 交互通信 动态 内存优化技术 推理系统 节点 插件 接入设备 网络拓扑结构 剪枝技术 通道 折叠技术 消除技术 模块 分配单元 机器学习技术 接口