摘要
本发明适用于视频处理技术领域,提供了一种长视频中特定事件的定位方法及系统。本发明通过构建轻量化模型,并进行本地部署;在能直接使用轻量化模型时,直接获取本地定位结果;在不能直接使用轻量化模型时,使用多模态大模型进行辅助推理,获取辅助定位结果,并对轻量化模型进行反哺升级。能够在能直接使用轻量化模型时,直接获取本地定位结果;在不能直接使用轻量化模型时,使用远端的多模态大模型进行辅助推理,并对轻量化模型进行反哺升级,从而将轻量化模型与多模态大模型进行有效的协同融合,在提升长视频中特定事件的定位能力的同时,也能利用多模态大模型的推理结果,实现本地部署的轻量化模型的自我升级,达到越用越好用的效果。