摘要
本发明涉及文本分类算法优化方法技术领域,尤其涉及基于机器学习的文本分类算法优化方法;技术方案:基于机器学习的文本分类算法优化方法,包括有数据收集与预处理的方法;本发明相较于传统文本分类算法优化方法,通常依赖特征工程和监督学习,需要大量的标记数据,对新领域或新任务,模型的泛化能力有限,需要重新收集大量标记数据进行训练,该文本分类算法优化方法通过结合深度学习和传统机器学习方法,利用深度学习的特征提取能力和传统机器学习的稳定性,获得更加鲁棒和高效的分类性能,同时通过大量的无标签数据进行预训练或自训练,无监督和半监督学习的可以大大提高模型的泛化能力。