基于上下文位置编码和傅里叶变换的语言模型训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于上下文位置编码和傅里叶变换的语言模型训练方法
申请号:CN202510655312
申请日期:2025-05-21
公开号:CN120633604A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了基于上下文位置编码和傅里叶变换的语言模型训练方法,属于计算机自然语言处理技术领域,包括以下步骤:S1、预处理用户输入的文本数据;S2、将预处理后的文本信息进行上下文位置编码;S3、经上下文位置编码后,再对每个相对位置编码向量进行傅里叶变换;S4、经过傅里叶变换后的位置编码向量,进行模型预训练和指令微调,利用最小化损失函数,衡量预测结果与真实目标之间的差异;S5、最后完成模型张量分布式并行训练。本发明提高了模型训练过程中的准确率,且适用于长上下文场景,能够实现准确的文本生成。
技术关键词
语言模型训练方法 模型预训练 编码向量 计算机自然语言 文本 图形处理器 生成向量 查询特征 关系建模 语法结构 语义 指令 注意力机制 数据 连续型 矩阵 参数 标签