训练样本生成、模型训练、提取方法、设备、介质及产品
申请号:CN202510909642
申请日期:2025-07-02
公开号:CN120763619A
公开日期:2025-10-10
类型:发明专利
摘要
本发明实施例公开了一种训练样本生成、模型训练、提取方法、设备、介质及产品,涉及计算机技术领域。该方法包括:获取原始日志数据,并对各原始日志数据进行标准化,得到第一日志数据集;对第一日志数据集中的各日志数据进行模式挖掘,得到日志数据模式集合;分别确定各日志数据模式包含的字段结构类型,提取各字段结构类型中的可变字段内容并进行变量命名,得到字段与变量之间的映射关系表;基于各原始日志数据、日志数据模式集合以及字段与变量之间的映射关系表生成各训练样本;各训练样本用于对日志数据的字段提取模型进行训练。本发明实施例的方案,可以快速且准确地生成训练样本,为训练得到日志数据的字段提取模型提供依据。
技术关键词
日志
映射关系表
生成方法
数据
字段
模式
变量
生成训练样本
序列
可读存储介质
机器学习模型
语义结构
计算机程序产品
聚类
节点
电子设备
处理器通信
实体