摘要
本发明实施例提供了一种论文查重方法、装置、设备和存储介质,该方法包括获取待查重论文的文本数据;确定待查重论文的文本数据对应的文本向量和文本分词;根据文本向量和文本分词,确定与待查重论文相匹配的至少一个目标论文;确定待查重论文与至少一个目标论文的重复率;通过大语言模型确定针对待查重论文与至少一个目标论文之间的查重建议;根据待查重论文与至少一个目标论文的重复率和查重建议,展示至少一个目标论文;本发明可以通过文本向量化捕捉语义信息,结合分词技术处理文本结构,兼顾内容相似性与关键词匹配,能够高效地筛选出相似度较高的论文文献,提高了查重的准确性。