基于AI服务器冗余系统的数据源故障处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于AI服务器冗余系统的数据源故障处理方法及系统
申请号:CN202410815794
申请日期:2024-06-24
公开号:CN118394576B
公开日期:2024-10-18
类型:发明专利
摘要
本发明属于AI数据源异常处理技术领域,具体涉及基于AI服务器冗余系统的数据源故障处理方法及系统,启动服务器时对其CPU系统中各CPU的状态参数进行检测,并以最佳优先级执行;实时监测当前运行CPU的状态,判断其是否异常,并切换至匹配的CPU,根据匹配结果更新当前优先级;匹配的CPU的DIMM内存条下发算法指令在匹配的CPU的NPU模组上重新计算;实时监测NPU的状态参数,执行最佳优先级;实时监测当前运行的各NPU状态,判断是否异常,执行最佳优先级;CPU将数据源下发给到匹配的NPU多计算一份,CPU再将解析后的数据源保存数据于NVMe盘。有效保障数据源不会随意丢失。
技术关键词
AI服务器 冗余系统 PCIe交换机 内存条 模组 映射关系表 AI算法 冗余备份系统 网络结构 操作系统 数据存储 程序 进程 指令 理论