摘要
本发明涉及一种多特征融合的多通道文本分类方法及系统,属于数据处理领域,包括:收集文本数据样本,进行文本预处理,并在字符与单词两个粒度上,构建字符嵌入以及单词嵌入;字符嵌入通过one‑hot编码,将字符转化为向量后输入卷积神经网络提取字符特征;同时,使用Word2Vec生成词向量;对字符向量以及词向量进行串联拼接,并利用自注意力机制生成字词向量;将字词向量分别输入至卷积神经网络和双向长短期记忆网络,提取两种字词特征,并串联拼接,得到综合字词特征;以字符特征以及综合字词特征分别作为多个通道的输入,利用自注意力机制确定融合文本特征后使用全连接网络进行文本分类。