摘要
本发明提供一种基于文本理解的质量问题信息智能匹配方法及系统,其中方法包括数据预处理,还包括:对预处理后的样本数据进行数据降维;进行特征提取,所述特征提取包括根据距离度量的特征提取、基于信息度量的特征提取、基于依赖性度量的特征提取和基于一致性度量的特征提取;使用向量空间模型对质量问题信息进行向量化;构建特征提取算法;计算中文文本相似度;构建相似度计算模块;构建问题预测软件模型,并进行质量问题信息智能匹配。本发明通过ET L过程对数据进行统一加工融合。针对融合后的高质量数据,研究基于机器学习的多种类型文本智能理解技术与基于规则与统计相结合的文本智能理解技术,通过问答的方式获取质量问题信息中的核心数据。