基于视频大语言模型的手术视频分析方法及相关设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视频大语言模型的手术视频分析方法及相关设备
申请号:CN202411494983
申请日期:2024-10-24
公开号:CN119621881B
公开日期:2025-12-16
类型:发明专利
摘要
一种基于视频大语言模型的手术视频分析方法及相关设备,涉及人工智能技术领域。其中方法包括:获取手术视频,以及所述手术视频对应的文本问题;将所述手术视频和所述文本问题输入至视频大语言模型,获取所述视频大语言模型输出的所述手术视频中视频片段对应的文本回答。实施本发明提供的技术方案,可以提高手术视频作为教学和参考资源的实用价值。
技术关键词
大语言模型 视频分析方法 文本 手术 语言模块 样本 视频编码器 编码模块 令牌 文字特征 非暂态计算机可读存储介质 处理器 人工智能技术 分类器 计算机程序产品 输出特征 存储器