摘要
本发明涉及数据处理技术领域,尤其涉及一种多模态数据标注方法,包括:确定待标注数据的数据类型和基础特征以确定初始关联锚点组;根据初始关联锚点组内关键字特征、视觉特征以及时序特征确定跨模态语义相似度,并结合视觉特征置信度对关键字特征文本修正以更新初始关联锚点组;构建差异化知识图谱,并结合预设语义关联规则进行候选锚点关联确定扩展关联置信度以确定锚点扩展处理方式;统计各初始关联锚点组在预设标注周期中若干时间子段内关联组激活频次,并结合时间子段衰减权重确定各初始关联锚点组的活跃度,根据活跃度和关联组激活频次确定各初始关联锚点组的推荐方式。本发明实现跨模态语义对齐,提高多模态数据标注准确性。