摘要
本发明提供一种基于大规模语言模型的数据分析方法,属于数据分析技术领域;步骤包括:步骤1:选择目标数据源,利用接口API调用目标数据源获取原始语句,预处理后得到第一文本序列;步骤2:根据历史库的历史语句,筛选重要提示词构建提示词模板;步骤3:利用提示词模板提取第一文本序列的所有特征,对第一文本序列的所有特征筛选得到重要特征;步骤4:将重要特征作为测试集,历史语句作为训练集,对初始语言模型进行训练,得到大规模语言模型;步骤5:将大规模语言模型配置到生产环境,大规模语言模型分析并处理生产环境的实际语句得到执行结果,判断执行结果和预期结果的误差。使数据分析方法完全通过自然语言实现,提高分析准确性。