摘要
本发明涉及深度学习技术领域,公开了一种面向错误标签数据的深度学习高效训练方法。本发明在整个训练流程中,Deem采用迭代式工作方式,在每轮迭代中同时执行错误标签清理和子集选择操作。本发明设计了一种低复杂度的贪心算法来求解,通过近似比的方式为子集实例分配权重建立与全集的映射关系,使子集梯度仍然能良好代表全集。为提升效率,Deem设计了自适应子集更新策略。每次迭代仅关注前次子集和数据集变化增量更新受影响部分,避免重复计算,提高训练效率。通过在6个数据集和10个基线方法上的广泛实验表明,Deem能在不牺牲模型准确性的前提下,将训练效率提升高达10倍。