一种基于复杂任务的高质量伪标注数据集构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于复杂任务的高质量伪标注数据集构建方法
申请号:CN202510461536
申请日期:2025-04-14
公开号:CN120297445B
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种基于复杂任务的高质量伪标注数据集构建方法,涉及多模态学习技术领域,包括,基于多模态原始数据构建跨模态因果图,并加载领域知识图谱,识别模态间混淆变量,并生成初始伪标签;通过强制切断跨模态因果图中非因果路径生成反事实样本,并对比原始样本与反事实样本的伪标签差异,生成跨模态去偏伪标签;结合跨模态去偏伪标签与语义一致性伪标签,融合生成多模态对齐、实体关系明确且语义一致的标准化伪标注数据集。本发明采用反事实干预框架,通过分析概率分布差异识别并消除跨模态交互中的非因果路径影响,有效抑制虚假关联。
技术关键词
数据集构建方法 跨模态 标签 语义 图谱 样本 多模态 动态 加权平均策略 结构方程模型 模态特征 指数衰减函数 实体 变量 关系 嵌入方法 编码器 节点 滑动窗口 处理器
系统为您推荐了相关专利信息
电子技术课程 教学管理方法 个性化学习路径 学生 节点
智能金属材料 接近传感方法 多模态分类器 高频振荡电路 接近传感装置
加密方法 变量 消息认证 密钥 明文
注意力机制 矫正辅助系统 动作特征提取方法 文本 语音识别模块
避障路径 智能驾驶避障方法 多源信息融合 车辆行驶信息 三维动态模型