语言模型的训练方法、自然语言处理方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
语言模型的训练方法、自然语言处理方法及装置
申请号:
CN202411389707
申请日期:
2024-09-30
公开号:
CN119227809A
公开日期:
2024-12-31
类型:
发明专利
摘要
本说明书提供一种语言模型的训练方法、自然语言处理方法及装置。所述语言模型的训练方法包括:针对原始数据集中的每个目标问题,利用语言模型对目标问题进行多次推理,得到多个回答数据,在每次推理时语言模型的温度值不同;从多个回答数据中筛选出第一重复度大于第一阈值的第一回答数据和第二重复度小于第二阈值的第二回答数据;将目标问题、第一回答数据和第二回答数据作为偏好数据,添加至偏好数据集;利用偏好数据集训练语言模型。
技术关键词
数据
文本
序列
自然语言
子模块
训练装置
训练语言模型
分词
处理器
输入模块
存储器
程序
参数