摘要
本发明提供一种地球科学大语言模型的训练方法、装置以及电子设备,涉及人工智能技术领域。所述地球科学大语言模型的训练方法,包括:获取第一混合训练数据集和第二混合训练数据集;利用第一混合训练数据集,对初始大语言模型进行针对通用领域和地球科学领域的继续预训练;其中,初始大语言模型为预训练后大语言模型;利用第二混合训练数据集,对继续预训练后的初始大语言模型进行针对通用领域和地球科学领域的指令精调,得到训练后的地球科学大语言模型,以利用地球科学大语言模型生成针对地球科学领域问题的答案。本发明可以训练得到具有良好的通用性能,且在地球科学领域具有良好表现的地球科学大语言模型。