一种基于大语言模型的任务执行方法、装置、介质及设备
申请号:CN202410978025
申请日期:2024-07-19
公开号:CN118711590A
公开日期:2024-09-27
类型:发明专利
摘要
本说明书公开了一种基于大语言模型的任务执行方法、装置、介质及设备,在接收第一分辨率的初始图像后,切分初始图像,得到若干个第二分辨率的图像块,并将每个图像块输入到用于转化第二分辨率的图像的视觉模块中,得到各图像块对应的编码数据,合并若干个图像块对应的编码数据,得到综合编码数据,将综合编码数据输入到预先调整的大语言模型中,得到初始图像对应的输出结果,并根据输出结果,执行目标任务。通过用于转化第二分辨率图像的视觉模块转化初始图像被切分出的若干个图像块,而后合并得到的若干个编码数据得到综合编码数据,实现了通过对应较小分辨率的视觉模块处理不同分辨率的图像,提高了大语言模型的图像处理效率。
技术关键词
图像块
分辨率
大语言模型
样本
视觉
矩阵
输入模块
偏差
处理器
执行装置
图像处理
可读存储介质
存储器
电子设备
计算机
编码
程序