一种应答信息生成方法、设备、介质及计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种应答信息生成方法、设备、介质及计算机程序产品
申请号:CN202510387245
申请日期:2025-03-31
公开号:CN119884332B
公开日期:2025-07-22
类型:发明专利
摘要
本发明公开了一种应答信息生成方法、设备、介质及计算机程序产品,涉及人工智能技术领域,针对预训练语言模型的并行推理计算的一个批次中,根据所在设备执行预填充任务的算力利用率确定预填充任务的词元预算数量和解码任务的词元预算数量,使解码任务的词元预算数量占比与预填充任务的算力利用率成负相关,根据该根据词元预算数量将对应的待处理序列输入预训练语言模型进行并行推理计算,使得并行推理计算获得吞吐量和延迟的均衡,从而可以解决相关技术中并行推理调度中存在的设备压力与生成性能矛盾的问题,达到提升预训练语言模型的并行推理性能的技术效果,提升了人工智能问答任务的执行性能。
技术关键词
信息生成方法 预训练语言模型 解码 序列 内存 计算机程序产品 键值 可读存储介质 存储计算机程序 人工智能技术 处理器 矩阵 散热风扇 电子设备 分块 存储器 损耗 指标
系统为您推荐了相关专利信息
噪声整形方法 自动编码器 无源光网络 量化噪声 神经网络权值
架空输电线路巡检 巡检路径规划 气流 线夹 时序
异构卷积神经网络 序列特征 恶意代码分类 恶意代码检测方法 多模态特征融合
生成混沌序列 加密方法 密钥 滑动窗口 认证标签
数字校准方法 时钟 数字逻辑电路 偏差 曲线