数据处理方法、生成方法及大语言模型训练系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据处理方法、生成方法及大语言模型训练系统
申请号:CN202411815386
申请日期:2024-12-10
公开号:CN119988534A
公开日期:2025-05-13
类型:发明专利
摘要
本说明书实施例提供数据处理方法、生成方法及大语言模型训练系统,所述数据处理方法包括:将问答任务对应的问题数据输入至大语言模型,大语言模型包含基础专家模块、专家路由模块和领域专家模块。通过基础专家模块预测问题数据获得基础答案数据,利用较为通用的专家模型将问题数据作为一般任务进行预测。利用专家路由模块在领域专家模块中选择匹配问答任务的目标专家子模块,将问题数据和作为目标专家子模块参考数据的基础答案数据输入目标专家子模块进行处理,获得问答任务对应的答案数据,目标专家子模块可以将基础答案数据作为参考,结合专家模块具备的特定领域数据预测能力对问题数据进行预测,提高答案数据的准确性。
技术关键词
大语言模型 数据处理方法 子模块 基础 答案 语言模型训练系统 基座 生成方法 服务端 客户端 指令 处理器 数据处理系统 存储计算机程序 计算机程序产品 矩阵 可读存储介质