一种嵌入式端侧推理工程化装置及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种嵌入式端侧推理工程化装置及方法
申请号:CN202510148617
申请日期:2025-02-11
公开号:CN120031135A
公开日期:2025-05-23
类型:发明专利
摘要
一种嵌入式端侧推理工程化装置及方法。涉及计算机技术工程领域。包括模型转换服务模块、推理服务模块、端侧代理服务模块。所述模型转换服务模块用于将模型转换为端侧设备支持的模型格式,并推送至平台上的模型仓库进行存储;所述推理服务模块用于将带有转换后模型文件的压缩包通过平台部署创建一个在端侧设备上运行的在线推理服务,完成部署后用户在平台上请求端侧在线推理服务;所述端侧代理服务模块用于在端侧创建并运行推理服务、监测推理服务健康状态、处理客户端发来的推理请求、终止并删除推理服务进程。本发明从云平台侧向端侧部署的推理服务器发起推理请求,获取端侧的推理结果。最终,将这些结果展示在平台侧的页面上。
技术关键词
模块 列表 进程 服务端 在线 推理服务器 转换单元 浏览器页面 仓库 客户端 格式 参数 数据存储 云平台 音频 图片 视频