基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备
申请号:CN202510477148
申请日期:2025-04-16
公开号:CN120412016A
公开日期:2025-08-01
类型:发明专利
摘要
本发明提供的基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备,方法包括:获得人脸视频片段;从人脸视频片段中提取低精度的rPPG信号以及多尺度融合视觉特征;生成关于人脸视频片段和rPPG信号的提示信息;由大语言模型根据rPPG信号、多尺度融合视觉特征和提示信息进行预测,得到高精度的rPPG信号。本发明利用大语言模型综合rPPG信号、多尺度融合视觉特征以及与rPPG信号有关的提示信息等多种信息源进行rPPG信号预测,可以提高最终的预测精度和稳健性。
技术关键词
融合视觉特征 信号感知方法 大语言模型 多尺度 人脸 视频 语义 令牌 原型 压缩器 电子设备 深度学习模型 文本 感知装置 精度 注意力机制 模块 处理器