问答信息的生成及多模态大模型训练方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
问答信息的生成及多模态大模型训练方法和装置
申请号:
CN202410796817
申请日期:
2024-06-19
公开号:
CN118586502A
公开日期:
2024-09-03
类型:
发明专利
摘要
本公开提供了问答信息的生成及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域,可应用于光学字符识别等场景。其中的问答信息的生成方法可包括:获取待处理的目标图像,目标图像中包括待解答的问题内容以及问题内容对应的配图;分别获取问题内容对应的文本模态信息以及配图对应的图像模态信息;结合文本模态信息以及图像模态信息,利用多模态大模型确定出问题内容对应的解答信息。
技术关键词
前馈神经网络
多模态
图像编码器
转换文本
视觉特征
特征金字塔网络
解码器
深度残差网络
融合特征
光学字符识别
序列
模型训练方法
位置编码信息
图框
模型训练模块
图像获取模块
多层感知机
系统为您推荐了相关专利信息
1
一种基于统计过程控制的数控加工质量监控方法及系统
监控方法
数字孪生
激光诱导击穿光谱
深度置信网络
闭环
2
一种基于语义计划指导的重排序多模态摘要生成方法
摘要生成方法
多模态
文本
计划
语义
3
基于SAM自适应微调的多模态半监督医学图像分割方法
医学图像分割方法
分层解码器
多模态
输出特征
医学图像分割系统
4
基于大模型技术的风资源评估报告生成方法
评估报告生成方法
文本
word2vec模型
融合词向量
数据可视化图表
5
一种基于大语言模型的供应链舞弊行为预警方法及装置
历史订单数据
大语言模型
预警模型
预警方法
关系网络图