摘要
本申请涉及文本处理和数据分析技术领域,尤其涉及一种矿用数据管理的字符串数据分组方法,包括,步骤一、遍历所有字符串数据,对字符串数据进行分组成字符串组;步骤二、对每个分组方案进行分组效果评价;步骤三、对多个分组方案进行两两对比,进行分组效果优化迭代,具体为:随机选择两个分组方案,并调换两个分组方案中的字符串组,形成新的分组方案,若新的分组方案效果优于原分组方案,则替代原方案。本发明通过根据分组效果进行迭代优化的方式,将组内字符串的共同子串长度和准确度进行综合考虑,可以让输出的分组结果提高组内共同子串的长度,同时满足分类准确的要求。