基于高速互通连接的语言模型检索推理系统、方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于高速互通连接的语言模型检索推理系统、方法
申请号:CN202510389049
申请日期:2025-03-31
公开号:CN119902900B
公开日期:2025-07-15
类型:发明专利
摘要
本申请公开基于高速互通连接的语言模型检索推理系统、方法,包括:主机、高速互通连接交换机、高速互通连接内存池、图像处理器,高速互通连接内存池内包括近存计算内存、双倍数据传输率内存,高速互通连接交换机内包含自适应分区模块;其中,主机通过高速互通连接交换机分别与高速互通连接内存池、图像处理器相连;主机,用于接收第一提示词,生成第二提示词,并将第二提示词通过高速互通连接交换机存储至双倍数据传输率内存;主机,还用于通过高速互通连接交换机,从双倍数据传输率内存中提取第二提示词进行推理,并利用连接到的高速互通连接交换机内自适应分区模块,确定推理阶段的任务分配对象,其中,分配对象为近存计算内存或图像处理器。
技术关键词
内存 交换机 图像处理器 推理系统 分区模块 互通技术 阶段 推理方法 对象 主机 数据 参数 日志 可读存储介质 指令 计算机程序产品 协议 存储器