摘要
本申请公开了一种用于文本情感倾向分析的数据预处理方法和装置,属于计算机技术领域。方法包括:对目标文本数据进行语句分割处理,获取第一目标语句;针对每一所述第一目标语句,基于预先存储的情感倾向词典库,分析所述第一目标语句是否包含第一目标结构的短语或第二目标结构的短语;对包含所述第一目标结构的短语的所述第一目标语句进行改写操作,和/或对包含所述第二目标结构的短语的所述第一目标语句执行移除操作,以清除第一目标语句中用词与第一目标语句实际表达语义相反或第一目标语句表达的情感和评价不明确的情况。本申请公开的用于文本情感倾向分析的数据预处理方法,能提高文本情感倾向分析的准确性。