一种基于大模型和注意力机制的多模态数据融合分类方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型和注意力机制的多模态数据融合分类方法
申请号:CN202410791163
申请日期:2024-06-19
公开号:CN118823528B
公开日期:2025-05-16
类型:发明专利
摘要
本发明属于计算机技术领域,涉及一种基于大模型和注意力机制的多模态数据融合分类方法;将第一图像特征向量和第二图像特征向量输入至分类模型中的滑动窗口交叉注意力融合模块,输出第一目标图像特征向量和第二目标图像特征向量;将第一目标图像特征向量、第二目标图像特征向量和文本特征向量输入至分类模型中的异构数据交叉注意力融合模块,输出目标对象的目标特征向量;将目标对象的目标特征向量输入至分类模型中的全连接层,输出目标对象的分类结果。本申请直接对不同图像特征进行融合,既融合了不同图像之间的特征信息,又避免了过度融合导致的过拟合风险,减少了信息冗余和噪声,可以更好地平衡文本模态和图像模态,提高了分类结果的准确性。
技术关键词
图像特征向量 数据融合分类方法 文本特征向量 前馈神经网络 子模块 注意力机制 视觉特征提取 异构 滑动窗口 特征值 对象 矩阵 采样模块 可读存储介质 特征提取器