一种基于大模型的视频描述与检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的视频描述与检索方法
申请号:CN202411025300
申请日期:2024-07-30
公开号:CN118551078B
公开日期:2024-10-01
类型:发明专利
摘要
本发明公开了一种基于大模型的视频描述与检索方法,涉及数据处理和视频检索技术领域。一种基于大模型的视频描述与检索方法,通过利用大模型的强大能力,实现对视频内容的描述和准确检索。在视频描述生成中,通过帧级信息提取、时序信息整合和视频描述生成步骤获取丰富的视频内容描述;在视频检索中,通过检索信息解析和基于视频描述的检索方法,获得准确的视频检索结果。通过更强大的表示学习能力和深入理解视频语义信息来提高检索的准确性和效率。
技术关键词
检索方法 图片 视频检索技术 自然语言信息 时序 融合方法 物体 视觉 生成方法 纹理 视频帧 颜色 场景 景深 语句 关系 语义 尺寸