一种应答信息生成方法、设备、介质及计算机程序产品

申请号：CN202510387245

申请日期：2025-03-31

公开号：CN119884332B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种应答信息生成方法、设备、介质及计算机程序产品，涉及人工智能技术领域，针对预训练语言模型的并行推理计算的一个批次中，根据所在设备执行预填充任务的算力利用率确定预填充任务的词元预算数量和解码任务的词元预算数量，使解码任务的词元预算数量占比与预填充任务的算力利用率成负相关，根据该根据词元预算数量将对应的待处理序列输入预训练语言模型进行并行推理计算，使得并行推理计算获得吞吐量和延迟的均衡，从而可以解决相关技术中并行推理调度中存在的设备压力与生成性能矛盾的问题，达到提升预训练语言模型的并行推理性能的技术效果，提升了人工智能问答任务的执行性能。

技术关键词

信息生成方法预训练语言模型解码序列内存计算机程序产品键值可读存储介质存储计算机程序人工智能技术处理器矩阵散热风扇电子设备分块存储器损耗指标

系统为您推荐了相关专利信息

一种无源光网络的噪声整形方法

噪声整形方法自动编码器无源光网络量化噪声神经网络权值

一种用于架空输电线路巡检的方法及系统

架空输电线路巡检巡检路径规划气流线夹时序

基于多模态特征融合的恶意代码检测方法、装置及设备

异构卷积神经网络序列特征恶意代码分类恶意代码检测方法多模态特征融合

一种网络数据的传输数据加密方法

生成混沌序列加密方法密钥滑动窗口认证标签

一种多相位时钟的数字校准方法及系统

数字校准方法时钟数字逻辑电路偏差曲线