一种文本生成模型的构建方法

申请号：CN202411031316

申请日期：2024-07-30

公开号：CN118551741B

公开日期：2024-10-15

类型：发明专利

摘要

本发明提供一种文本生成模型的构建方法，涉及人工智能技术领域。所述方法包括：获取指定文本生成模型中每个FFN层对应的模型参数；获取FFN层中的神经元在变换处理中的激活特征，即共同激活矩阵、激活次数向量以及激活数量列表；基于FFN层对应的共同激活矩阵以及激活次数向量，将FFN层中的神经元按照拆分数划分为多个目标神经元组；针对预设数量个专家，基于多个目标神经元组从模型参数中提取每个专家对应的目标模型参数；利用所有激活数量列表以及目标模型参数，构建目标文本生成模型。本发明利用指定文本生成模型中的先验知识，可快速合理地配置目标文本生成模型的参数，进而可实现目标文本生成模型的快速部署，提升文本生成效率。

技术关键词

索引列表文本生成模型矩阵字典元素参数前馈神经网络副本关系人工智能技术

系统为您推荐了相关专利信息

基于决策导向时段划分的配电网动态重构方法、设备及介质

决策时段划分方法矩阵谱聚类算法拉普拉斯

一种基于机器学习的入侵行为预警方法和装置

预警模型区块链交易数据交互网络智能合约代码静态特征

基于深度学习分类的艾滋病分子传播网络监测方法及装置

网络监测方法深度学习分类数据分类神经网络模型网络特征

一种基于大语言模型的数据采集方法、设备及介质

关键词数据采集方法大语言模型网址分布直方图

一种医疗器械注册证OCR识别系统

识别系统医疗器械图像增强单元文本识别模型校验模块