一种基于混合编码方式和textRCNN模型的电力数据智能分类方法及系统
申请号:CN202510798134
申请日期:2025-06-16
公开号:CN120705733A
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及文本处理技术领域,特别涉及一种基于混合编码方式和textRCNN模型的电力数据智能分类方法及系统。方法包括:数据预处理,对原始电力数据进行清洗和标准化处理;多编码生成,使用多种编码方式(包括词袋模型、TF‑IDF编码、词嵌入、one‑hot编码)对预处理后的数据进行编码,生成相应的向量表示;向量拼接,将不同编码方式生成的向量拼接成一个新的综合向量,相对于传统的编码方式,特征更加丰富;构建TextRCNN模型并进行训练,使用拼接后的综合向量作为输入,训练TextRCNN模型;得到分类结果,训练完成后,将需要分类的数据通过上述方式生成一个综合向量,经过模型处理得到最终分类结果;本发明在电力数据分类的任务中表现出更高的准确性和鲁棒性。
技术关键词
数据智能分类
电力
编码
词袋模型
Word2Vec模型
文本处理技术
可读存储介质
模型训练模块
标签
拼接模块
索引
数据分类
计算机
代表
频率
鲁棒性
处理器
矩阵