摘要
本发明属于自然语言处理领域,公开了基于多特征融合的文本对话连贯性识别系统,包括:数据采集模块,用于采集文本对话数据,并对采集到的数据进行预处理,所述预处理包括清洗、分词、词性标注操作;特征提取模块,用于从输入的文本对话中提取至少一个语言特征和至少一个上下文特征;特征融合模块,用于将所述语言特征和所述上下文特征融合成一个综合特征表示;连贯性识别模块,用于基于融合后的特征对文本对话的连贯性进行识别;连贯性评估模块,用于对连贯性识别结果进行评估;结果输出模块,用于将所述连贯性评估模块的评估结果输出给用户。通过融合多种语言特征和上下文特征,可以更全面地捕捉文本的语义信息,从而提高连贯性识别的准确性。