地球科学大语言模型的训练方法、装置以及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
地球科学大语言模型的训练方法、装置以及电子设备
申请号:CN202410880707
申请日期:2024-07-02
公开号:CN119047567A
公开日期:2024-11-29
类型:发明专利
摘要
本发明提供一种地球科学大语言模型的训练方法、装置以及电子设备,涉及人工智能技术领域。所述地球科学大语言模型的训练方法,包括:获取第一混合训练数据集和第二混合训练数据集;利用第一混合训练数据集,对初始大语言模型进行针对通用领域和地球科学领域的继续预训练;其中,初始大语言模型为预训练后大语言模型;利用第二混合训练数据集,对继续预训练后的初始大语言模型进行针对通用领域和地球科学领域的指令精调,得到训练后的地球科学大语言模型,以利用地球科学大语言模型生成针对地球科学领域问题的答案。本发明可以训练得到具有良好的通用性能,且在地球科学领域具有良好表现的地球科学大语言模型。
技术关键词
大语言模型 数据 文本 非暂态计算机可读存储介质 电子设备 答案 处理器 人工智能技术 指令 计算机程序产品 训练装置 存储器 标签 算法 模块 参数