摘要
本申请涉及一种基于人工智能的烟草数据采集分析系统,该系统包括多源数据采集模块,用于基于已制定的轮询机制自动增量采集烟草的语料数据和网络观测数据,统一格式后输出为烟草数据;数据处理与转换模块,用于对烟草数据清洗、校验、统一编码并生成标准化数据;智能分析模块,用于将标准化数据特征提取后降维生成结构化数据集,基于对接的大语言模型融合随机森林模型深度分析结构化数据集后,通过优化大语言模型的超参数配置动态优化并生成分析结果;基于优化后的分析结果生成可视化工具。本申请有效解决传统数据采集分析系统无法针对复杂的烟草数据自动化采集,并依照其数据特征获取智能化分析结果和可视化工具的问题。