大模型的训练方法、视频处理方法、装置及相关设备

申请号：CN202411071796

申请日期：2024-08-06

公开号：CN119026075A

公开日期：2024-11-26

类型：发明专利

摘要

本申请提供一种大模型的训练方法、视频处理方法、装置及相关设备，该方法包括：对样本视频进行预处理，得到多个视频帧、时间戳指令文本和任务指令文本；对时间戳指令文本和任务指令文本进行分词，得到时间戳指令分词文本和任务指令分词文本；对多个视频帧、时间戳指令分词文本和任务指令分词文本进行特征转换，得到第一目标特征；使用第一目标特征对预设大模型进行指令调整，得到目标大模型。本申请通过将样本视频进行预处理后得到多个视频帧、时间戳指令文本和任务指令文本，并由此进行特征融合和转换，得到第一目标特征并对预设大模型进行指令调整，得到目标大模型，更好地考虑视频动作和文本描述的关系，提高了大模型对视频处理的准确度。

技术关键词

文本编码特征分词视频帧指令音频生成方法计算机程序产品图像特征提取模型滑动窗口样本答案生成应用程序模版处理器模块编码器训练装置存储器

系统为您推荐了相关专利信息

一种基于logstash和nebula的数据图形化展示及分析方法

企业分析方法构建数据结构关系社交网络分析

一种雷达成像DSP性能优化方法及装置

回波性能优化方法多普勒信号滤波器弯曲矫正

一种动画生成方法、模型训练方法、装置及电子设备

神经网络模型音频特征面部样本动画生成方法

一种基于自适应评分算法和多模态分析的评审系统及方法

评审系统评分算法模态分析视频分析技术大学生创新创业

隧道断面空间潜在病害识别方法及相关装置

隧道断面病害识别方法 AAM模型数据度计算方法