摘要
本发明公开了一种基于大数据的科研平台系统,所述方法包括:通过本公开的处理方案,数据抽取模块,用于通过使用增量式的抽取算法进行模式数据和实例数据抽取;数据集成模块,用于将所述模式数据和实例数据进行统一映射,转换为单一的结果集;数据规约模块,用于消除数据集成后的相似重复记录;数据装载模块,用于将数据规约后的数据集装载到一个或多个目的数据库;终点数据存储模块,用于储存装载后的数据与元数据。通过本公开的处理方案,汇聚多种数据,并对提取数据进行统一规则数据清洗、整合聚集数据表达、建立模型数据分析,并通过文本挖掘、深度学习、聚类、关联规则、逻辑回归等算法,最终实现合理解释可视化。