文本确定方法、多模态大模型训练方法以及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本确定方法、多模态大模型训练方法以及设备
申请号:CN202411858879
申请日期:2024-12-16
公开号:CN119862957A
公开日期:2025-04-22
类型:发明专利
摘要
本公开提供了基于多模态大模型的文本确定方法、多模态大模型训练方法以及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、自然语言处理、大模型等技术领域。具体实现方案为:通过多模态大模型中的编码网络、目标图像以及目标图像对应的任务描述文本确定出第一词元序列,并将第一词元序列输入多模态大模型中的大语言模型,获取输出的第一词元特征序列,以及将第一词元特征序列中最后一个词元特征分别输入多模态大模型中的各个解码网络,获取各个解码网络输出的目标词元,并根据第一词元序列和目标词元,得到目标文本。
技术关键词
序列 解码网络 大语言模型 多模态 文本编码器 图像 样本 模型训练方法 人工智能技术 计算机程序产品 计算机视觉 过滤模块 训练装置 处理器通信