摘要
本发明属于查重管理技术领域,具体涉及一种投标文件查重及异常分析方法及系统,方法包括:建立包含多条异常项的异常数据库;获取同一项目或同一标段的所有投标文件;基于Simhash改进算法计算任意两个投标文件的文本相似度;识别任意两个投标文件中重复内容;重复内容包括重复文本和重复图片;定义符合异常数据库中任一条异常项的重复内容为异常数据;根据异常数据和文本相似度生成异常报告。该投标文件查重及异常分析方法,提高了投标文件查重及异常分析的准确性、全面性,通过智能分析方法提升了查重的效率,使得投标文件查重及异常分析智能化、科学化、自动化。