摘要
本发明属于大数据分析领域,提供了一种科技创新大数据分析挖掘方法,包括:待分析内容收集、科技创新内容判断、文本拆分、内容预处理、结构化数据和非结构化数据识别、非结构化权重集提取、结构化权重集提取、输入数据构建、数据挖掘以及键值对输出整合。本发明通过进行科技创新内容判断从数据收集阶段过滤了非研究方向内容,提高了用于数据挖掘的内容质量;通过对结构化数据和非结构化数据进行权重添加,提取了内容的核心部分,降低了数据挖掘量,提高了数据挖掘的效率;通过对结构化数据和非结构化数据加权和组合,实现了结构化数据和非结构化数据的同步挖掘。