基于多模态大语言模型的体育视频解说评价方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态大语言模型的体育视频解说评价方法及系统
申请号:CN202510597489
申请日期:2025-05-09
公开号:CN120495958A
公开日期:2025-08-15
类型:发明专利
摘要
本申请基于多模态大语言模型的体育视频解说评价方法及系统,包括:获取数据集,所述数据集包括体育解说的视频片段与文本解说所构成的数据对;将所述数据集进行语义分类,确定语义标签,所述语义标签将所述数据对分成以下至少之一:关键事件描述、技术细节分析、背景信息解释、战术分析、比赛情况解释与情感表达;构建多模态大语言模型,调用所述数据集训练所述多模态大语言模型,确定体育视频解说模型;对所述体育视频解说模型进行评分,确定评价结果。本申请通过多维度评估方法能更全面地反映模型在体育解说任务中的表现,克服了传统指标无法捕捉细粒度专业细节、时间动态和人类情感的局限性。
技术关键词
大语言模型 体育 视频 语义标签 文本 多模态 多维度评估方法 语句 评价方法 语义特征 双向注意力 视觉 融合特征 主题 运动员 展示模型 数据获取模块 字符