一种文本生成模型的构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文本生成模型的构建方法
申请号:CN202411031316
申请日期:2024-07-30
公开号:CN118551741B
公开日期:2024-10-15
类型:发明专利
摘要
本发明提供一种文本生成模型的构建方法,涉及人工智能技术领域。所述方法包括:获取指定文本生成模型中每个FFN层对应的模型参数;获取FFN层中的神经元在变换处理中的激活特征,即共同激活矩阵、激活次数向量以及激活数量列表;基于FFN层对应的共同激活矩阵以及激活次数向量,将FFN层中的神经元按照拆分数划分为多个目标神经元组;针对预设数量个专家,基于多个目标神经元组从模型参数中提取每个专家对应的目标模型参数;利用所有激活数量列表以及目标模型参数,构建目标文本生成模型。本发明利用指定文本生成模型中的先验知识,可快速合理地配置目标文本生成模型的参数,进而可实现目标文本生成模型的快速部署,提升文本生成效率。
技术关键词
索引 列表 文本生成模型 矩阵 字典 元素 参数 前馈神经网络 副本 关系 人工智能技术
系统为您推荐了相关专利信息
决策 时段划分方法 矩阵 谱聚类算法 拉普拉斯
预警模型 区块链交易数据 交互网络 智能合约代码 静态特征
网络监测方法 深度学习分类 数据分类 神经网络模型 网络特征
关键词 数据采集方法 大语言模型 网址 分布直方图
识别系统 医疗器械 图像增强单元 文本识别模型 校验模块