一种视频理解的处理方法、装置、设备以及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种视频理解的处理方法、装置、设备以及存储介质
申请号:CN202510738183
申请日期:2025-06-04
公开号:CN120564105A
公开日期:2025-08-29
类型:发明专利
摘要
本申请提供一种视频理解的处理方法、装置、设备以及存储介质,属于视频理解的技术领域。所述方法包括获取目标视频和目标提问文本,并根据所述目标提问文本,生成视频段检索指示文本;将所述目标视频、目标提问文本和所述视频段检索指示文本输入所述粗粒度视频大语言模型,所述视频段检索指示文本用于指示所述粗粒度视频大语言模型在所述目标视频中提取与所述目标提问文本相关的关键片段;将所述粗粒度视频大语言模型输出的所述关键片段和所述目标提问文本输入所述细粒度视频大语言模型,所述细粒度视频大语言模型用于根据所述关键片段和所述目标提问文本输出最终回答。本申请旨在提高视频理解结果准确性。
技术关键词
大语言模型 文本 视频段 非易失性可读存储介质 样本 强化学习策略 视觉 处理器 存储器 标签 电子设备 模块
系统为您推荐了相关专利信息
智能生成方法 视觉特征 对象 多模态 意图
图谱 溯源方法 三元组 故障知识库 推理算法
智能故障诊断装置 故障预测模型 现场可更换单元 故障发生率 处理单元
词语 关键词抽取方法 分词 样本 中文文本分类
疏水方法 参数 样本 神经网络模型 节点