一种通过增量信息感知增强视频描述生成的方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种通过增量信息感知增强视频描述生成的方法及系统
申请号:CN202510730429
申请日期:2025-06-03
公开号:CN120640092A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提出了一种通过增量信息感知增强视频描述生成的方法及系统。该方法通过构建包含语义增量信息感知模型和结构增量信息感知模型的视频描述生成模型,分别捕捉视频中的详细语义信息和关键结构内容,量化所有描述的语义和结构信息,并在训练过程中利用低信息量描述监督基本编码器以捕获基础视频信息,利用高信息量描述共同监督基本编码器和增量信息编码器,从而引导模型感知和利用从基础信息到更丰富信息的增量信息。在推理阶段,通过融合语义增量信息感知模型和结构增量信息感知模型来补偿语义增量信息感知模型在理解视频主要信息方面的局限性,提高了视频描述生成的准确率和语义丰富度。
技术关键词
信息编码器 解码器 融合语义 视频帧 生成结构 输入结构 模块 全局特征提取 基础 序列 阶段 参数 周期 数据 文本
系统为您推荐了相关专利信息
视频生成方法 图像生成器 视频生成模型 人类 解码器
生成方法 编码模块 图像块特征 样本 随机噪声
异常检测方法 样本 算法 坐标 列表
游戏图像 文本 游戏辅助方法 视频帧 时间段
三维重建方法 生成三维模型 卷积神经网络提取 三维重建设备 三维重建装置