一种多特征融合的多通道文本分类方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多特征融合的多通道文本分类方法及系统
申请号:CN202411911451
申请日期:2024-12-24
公开号:CN119848261A
公开日期:2025-04-18
类型:发明专利
摘要
本发明涉及一种多特征融合的多通道文本分类方法及系统,属于数据处理领域,包括:收集文本数据样本,进行文本预处理,并在字符与单词两个粒度上,构建字符嵌入以及单词嵌入;字符嵌入通过one‑hot编码,将字符转化为向量后输入卷积神经网络提取字符特征;同时,使用Word2Vec生成词向量;对字符向量以及词向量进行串联拼接,并利用自注意力机制生成字词向量;将字词向量分别输入至卷积神经网络和双向长短期记忆网络,提取两种字词特征,并串联拼接,得到综合字词特征;以字符特征以及综合字词特征分别作为多个通道的输入,利用自注意力机制确定融合文本特征后使用全连接网络进行文本分类。
技术关键词
文本分类方法 字词 多通道 字符 注意力机制 矩阵 池化特征 Word2Vec模型 计算机可读指令 卷积神经网络提取 文本分类系统 注意力模型 编码技术 样本 键值 滑动窗口