一种基于图像的多模态眼动表征方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于图像的多模态眼动表征方法及系统
申请号:CN202510305690
申请日期:2025-03-14
公开号:CN120220219A
公开日期:2025-06-27
类型:发明专利
摘要
本公开提供了一种基于图像的多模态眼动表征方法及系统,属于眼动表征技术领域,该方法包括:对原始眼动数据进行转换,得到原始眼动数据对应的眼动线形图;基于眼动特征得到扫视路径,眼动特征是对原始眼动数据进行特征提取后的特征;对眼动线形图进行编码,得到目标图像隐向量,基于扫视路径所对应的文本信息进行编码,得到目标文本隐向量;对目标图像隐向量和目标文本隐向量进行融合,得到综合隐向量;将综合隐向量输入自注意力网络进行传递,得到眼动表征。本公开提供的一种基于图像的多模态眼动表征方法及系统能够提高眼动表征的质量。
技术关键词
眼动数据 表征方法 眼动特征 文本 图像 协方差矩阵 补丁 线性 注视点 注意力 可读存储介质 多模态 表征技术 表征系统 序列 变量 处理器 元素 编码模块
系统为您推荐了相关专利信息
统计方法 结晶 组织 压铸合金 图像分割
车辆识别 监控警报系统 警报方法 规划 区域监控技术
大语言模型 文本段落 文本生成方法 多模态 计算机执行指令
智能印章 原始文档图像 印章识别系统 识别方法 序列
心理评估系统 测试题 人工智能模型训练 图像识别模型 心理状态评估技术