针对长尾噪声的模型训练方法、装置、设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
针对长尾噪声的模型训练方法、装置、设备和介质
申请号:CN202510345862
申请日期:2025-03-24
公开号:CN119888412B
公开日期:2025-07-08
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,特别涉及针对长尾噪声的模型训练方法、装置、设备和介质,方法包括将输入图像、文本提示词和观测标签输入预训练的视觉语言模型中,视觉语言模型的图像编码器中设置有微调模块;在视觉语言模型中得到文本特征、图像特征及对各个类别的原始输出值,并得到文本预测标签;确定监督启停状态和目标损失函数,并基于目标损失函数对微调模块进行更新,以得到完成训练的视觉语言模型。本申请通过评估文本预测标签和观察标签之间的差异确定是否需要文本图像对齐先验辅助监督,通过校准学习到的特征和观测标签之间的偏差,进而提高了头部类和尾部类样本在高噪声场景下的分类准确率。
技术关键词
模型训练方法 图像编码器 标签 文本编码器 噪声数据 计算机视觉技术 模型训练装置 分类准确率 可读存储介质 特征提取模块 处理器 输入模块 存储器