基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备
申请号:CN202510477148
申请日期:2025-04-16
公开号:CN120412016A
公开日期:2025-08-01
类型:发明专利
摘要
本发明提供的基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备,方法包括:获得人脸视频片段;从人脸视频片段中提取低精度的rPPG信号以及多尺度融合视觉特征;生成关于人脸视频片段和rPPG信号的提示信息;由大语言模型根据rPPG信号、多尺度融合视觉特征和提示信息进行预测,得到高精度的rPPG信号。本发明利用大语言模型综合rPPG信号、多尺度融合视觉特征以及与rPPG信号有关的提示信息等多种信息源进行rPPG信号预测,可以提高最终的预测精度和稳健性。
技术关键词
融合视觉特征
信号感知方法
大语言模型
多尺度
人脸
视频
语义
令牌
原型
压缩器
电子设备
深度学习模型
文本
感知装置
精度
注意力机制
模块
处理器