一种基于图像的多模态眼动表征方法及系统

申请号：CN202510305690

申请日期：2025-03-14

公开号：CN120220219A

公开日期：2025-06-27

类型：发明专利

摘要

本公开提供了一种基于图像的多模态眼动表征方法及系统，属于眼动表征技术领域，该方法包括：对原始眼动数据进行转换，得到原始眼动数据对应的眼动线形图；基于眼动特征得到扫视路径，眼动特征是对原始眼动数据进行特征提取后的特征；对眼动线形图进行编码，得到目标图像隐向量，基于扫视路径所对应的文本信息进行编码，得到目标文本隐向量；对目标图像隐向量和目标文本隐向量进行融合，得到综合隐向量；将综合隐向量输入自注意力网络进行传递，得到眼动表征。本公开提供的一种基于图像的多模态眼动表征方法及系统能够提高眼动表征的质量。

技术关键词

眼动数据表征方法眼动特征文本图像协方差矩阵补丁线性注视点注意力可读存储介质多模态表征技术表征系统序列变量处理器元素编码模块

系统为您推荐了相关专利信息

一种压铸预结晶缺陷组织智能识别与统计方法

统计方法结晶组织压铸合金图像分割

施工危险区域出入监控警报系统及方法

车辆识别监控警报系统警报方法规划区域监控技术

长文本生成方法、装置、电子设备及存储介质

大语言模型文本段落文本生成方法多模态计算机执行指令

一种智能印章识别方法以及印章识别系统

智能印章原始文档图像印章识别系统识别方法序列

一种基于人工智能的心理评估系统及方法

心理评估系统测试题人工智能模型训练图像识别模型心理状态评估技术