一种服务器、中心服务器及基于大模型的任务处理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种服务器、中心服务器及基于大模型的任务处理方法
申请号:CN202411875163
申请日期:2024-12-18
公开号:CN119847735A
公开日期:2025-04-18
类型:发明专利
摘要
本申请涉及人工智能技术领域,尤其涉及一种服务器、中心服务器及基于大模型的任务处理方法。若接收算法类型为大小模型融合的待处理任务,且用于执行小模型任务的第一GPU的剩余资源无法对待处理任务进行处理,为了及时处理任务,若用于执行大模型任务的第二GPU的剩余资源能够基于小模型对待处理任务进行处理,在该第二GPU中加载待处理任务的目标小模型,得到目标小模型输出的第一结果,根据第一结果确定待复检数据,在第二GPU加载目标大模型,基于目标大模型对待复检数据复检,得到待处理任务的目标结果。通过多GPU搭配组合的处理方式提高了资源利用率及任务处理的效率,并通过大小模型相结合的方式提高了任务处理的准确率。
技术关键词
中心服务器 资源 数据 队列 人工智能技术 算法