一种样本自动化处理方法、装置、计算机设备及存储介质
申请号:CN202411687985
申请日期:2024-11-22
公开号:CN119577449A
公开日期:2025-03-07
类型:发明专利
摘要
本申请公开一种样本自动化处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。首先,对预先收集的训练样本进行分类,分为完全观测样本和不完全观测样本。针对完全观测样本,通过预训练的标注预测模型生成第一标签预测值,并计算第一标签预测值的对除值,进而构建对除值分布曲线,并提取其端点值作为置信阈值。随后,将不完全观测样本输入标注预测模型,生成伪标签和第二标签预测值,并将第二标签预测值与置信阈值进行比对。如果第二标签预测值达到或超过置信阈值,则将样本归为正样本;否则归为负样本。本申请还涉及区块链技术领域,训练样本存储在区块链网络上。本申请提高了伪标签生成的可靠性和准确性,降低了人工干预和复杂性。
技术关键词
标签预测值
样本
计算机可读指令
数据格式
机器学习模型
曲线
端点
计算机设备
迁移学习算法
融合特征
可读存储介质
人工智能技术
区块链技术
模块
处理器
序列
存储器
时序