开放词汇检测模型的训练方法、装置和电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
开放词汇检测模型的训练方法、装置和电子设备
申请号:CN202511196300
申请日期:2025-08-26
公开号:CN120726615A
公开日期:2025-09-30
类型:发明专利
摘要
本申请实施例提供一种开放词汇检测模型的训练方法、装置和电子设备。开放词汇检测模型的训练方法包括:获取样本数据;样本数据包括样本图像、样本文本和标签信息,将样本数据输入待训练的神经网络模型中,提取样本文本的文本特征信息和样本图像的图像特征信息;根据图像特征信息生成动态文本提示信息;将文本特征信息和动态文本提示信息进行融合处理,得到语义融合特征信息;根据语义融合特征信息对样本图像中的对象进行预测;根据对象预测结果、标签信息、文本特征信息、动态文本提示信息和语义融合特征信息,对神经网络模型进行迭代训练,得到开放词汇检测模型。本申请能够提升开放词汇检测模型的上下文感知、语义泛化及细粒度理解能力。
技术关键词
神经网络模型 融合特征 图像特征信息 样本 语义 动态 对象检测 标签 文本编码器 检测损失 预测类别 电子设备 数据 训练装置 重构 存储器 处理器