摘要
本发明公开了一种应用于电商客服数智化管理系统的数据聚合方法,其属于大数据资源服务的技术领域,其利用结巴分词对评论的文本内容进行分词处理,并使用word2vec模型得到反映该评论文本特征的文本向量;再采用SVM分类算法,得到文本是否为数学公式或特定格式的数据的判断;然后,对第一分类器中非数学公式、非特定格式的评论文本数据使用第二分类器进行分类。先对评论的文本进行语种判断,如果是中文,则使用中文的特征提取方式,如果为英文,则使用英文的特征提取方式;最后,使用SVM模型将特征提取后的数据进行分类处理,从而得到该评论文本是否具有价值性的最终判断结果。本发明解决了如何对电商平台进行数据聚合以识别数据的潜在价值的技术问题。