摘要
本发明公开了基于大语言模型的多维度流量数据合成方法及系统,该方法获取历史表格数据,所述历史表格数据包括多个不同维度的流量相关数据;对所述历史表格数据中的流量相关数据进行文本特征编码,得到历史文本编码特征;构建的自回归大型语言模型,并使用所述历史文本编码特征对所述自回归大型语言模型进行微调;获取目标表格数据,并用所述自回归大型语言模型对所述目标表格数据进行采样,根据采样结果生成合成表格数据,相比现有技术,本发明能利用大语言模型在任意条件下灵活有效地合成拥有高保真度、高实用性以及有效的隐私保护性的移动蜂窝网络数据,并且在合成数据时采用重生成策略,大大提高了数据合成的效率。