一种面向多模态多语言信息的歧视检测方法及装置

申请号：CN202510137826

申请日期：2025-02-07

公开号：CN120144794A

公开日期：2025-06-13

类型：发明专利

摘要

本申请提出一种面向多模态多语言信息的歧视检测方法及装置，其中，方法包括：采用ViT图像编码器和XLM‑R文本编码器分别提取图像和多语言文本特征，并通过交叉注意力机制实现模态间深度交互，生成多模态融合特征，全面捕捉图像与文本之间的细粒度关联；采用LoRA微调技术冻结预训练模型的图像和文本编码器，仅对分类器进行低秩参数优化，显著降低计算资源需求；引入动态记忆机制，通过检索历史样本信息和动态融合当前特征，增强模型对复杂歧视信号的识别能力，并对新输入的数据进行精准预测。本申请突破了现有方法的语言局限性，可在多语言、多文化背景下实现歧视信号的精准检测，填补了多模态歧视检测在多语言环境中的空白。

技术关键词

融合特征文本编码器分类器图像编码器多模态交叉注意力机制交互特征样本嵌入特征记忆机制矩阵多语言门控循环单元模态特征动态预训练模型数据

系统为您推荐了相关专利信息

一种基于DeepSeek的智能移动中控屏系统

屏幕显示模块多模态交互调节电机滑动轴深度学习框架

多模态数据转换方法、装置及计算机设备

多模态数据转换方法层级音频文本

用于甲基苯丙胺障碍的戒断期神经恢复脑网络预测方法和系统

网络多模态数据融合全脑功能多元线性回归模型 T1加权图像

基于机器视觉的粉尘智能识别方法及系统

智能识别方法粉尘纹理特征提取融合特征视觉

一种基于自适应神经网络的二次侧非能动余热排出系统物理过程失效分析方法

失效分析方法系统关键参数热交换器管燃料元件包壳训练集