一种基于多模态模型进行视频对象搜索的方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态模型进行视频对象搜索的方法
申请号:CN202510380666
申请日期:2025-03-28
公开号:CN119884418A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于多模态模型进行视频对象搜索的方法,基于自研的多模态模型构建了一整套从视频数据预处理、特征提取到多模态融合与匹配的人员搜索流程,能够根据文本输入快速从海量图片(视频)中检索目标对象;使用了先进的多模态技术实现了对视频内容的综合分析和理解,通过结合自然语言描述,视频快速定位的方式提供了自动化的人员识别和定位能力,可以快速、精准地在海量视频中找到目标人物,显著缩短了搜索时间,减少了人工干预,大幅提升了效率和准确性。
技术关键词
多模态 非易失性存储介质 计算机可读指令 对象 视频流 模态技术 机器学习模型 数据 文本 图片 生成向量 信息编码 非机动车 机动车辆 自然语言 电子装置 图像 存储器
系统为您推荐了相关专利信息
入侵检测方法 令牌 列表 工作站执行 语句
控制权 视频流同步 画面 大语言模型 意图
远程智能监控系统 在线增量学习 多模态 实用拜占庭容错 验证数据完整性
运动生成模型 运动特征 运动生成方法 信号 语义