摘要
本申请实施例公开了一种基于机器学习的大数据预处理方法及系统,方法包括:获取RPA系统的运行日志数据集合,运行日志数据集合包括多个会话交互记录;对运行日志数据集合进行数据清洗处理,得到预处理后的运行日志数据集合;基于预设的特征提取算法对预处理后的运行日志数据集合进行特征抽取处理,得到每个会话交互记录的文本语义特征和操作序列特征;调用机器学习模型对文本语义特征和操作序列特征进行联合建模处理,生成会话交互记录的异常检测结果,并基于异常检测结果调整RPA系统的任务执行策略。由此,可以提升RPA系统的稳定性和效率,保障业务流程的顺畅进行。