基于多模态对比学习的多视角专注度识别方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
AI新闻日报
AITNT公众号
AITNT交流群
搜索
未登录
首页
AI中心
退出
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
寻求报道
基于多模态对比学习的多视角专注度识别方法及系统
申请号:
CN202511176038
申请日期:
2025-08-21
公开号:
CN120913284A
公开日期:
2025-11-07
类型:
发明专利
摘要
本发明提供基于多模态对比学习的多视角专注度识别方法及系统,包括:构建涵盖行为维度、情感维度及认知维度的专注度视觉属性集;利用大语言模型对专注度视觉属性集生成描述专注度类别的类特定提示及描述单帧视觉特征的帧特定提示;基于类特定提示和帧特定提示,作为文本编码器输入,结合视频编码器预设的提示,输出多模态特征;对多模态特征,执行视频到文本的对齐和文本到视频的对齐,计算全局和局部对齐相似度分数;基于全局和局部对齐相似度分数,构建对比损失函数,完成识别。
技术关键词
专注度识别方法
视角
多模态特征
视频编码器
视觉特征
大语言模型
文本编码器
注意力
样本
语义
细粒度特征
融合全局
可读存储介质
处理器
时序特征