多模态数据融合控制方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态数据融合控制方法、装置、设备及介质
申请号:CN202411056986
申请日期:2024-08-02
公开号:CN118734250A
公开日期:2024-10-01
类型:发明专利
摘要
本发明涉及计算机技术领域,公开了一种多模态数据融合控制方法、装置、设备及介质,该方法通过在预训练语言模型的Embedding层和Transformer编码器层引入跨模态注意力,实现模态间信息在不同语义层次上的充分融合,形成富有层次性和语义交互性的多模态表示;自适应地调节不同模态信息在多模态融合过程中的重要性权重,实现灵活、动态的跨模态信息交互,提高模型在不同场景下的适应能力和泛化能力;显式地转化生成内容与源输入在语义层面的一致性,并实时评估生成内容与其中一种模态数据之间的相关性,提高模型输出内容的准确性、相关性和可靠性,这样显著提升模型在跨模态理解和生成任务中的性能表现,提高硬件处理效率。
技术关键词
跨模态融合特征 融合控制方法 多模态数据融合 预训练语言模型 多任务联合训练 多层次 模态特征 文本 线性变换矩阵 注意力机制 高层语义特征 图像 编码器