摘要
本发明公开了一种融合多种策略的科技文献主题挖掘方法,包括负采样生成训练数据、构建深度引文分析主题模型、模型训练、科研主题提取和引文预测5大步骤,通过融合深度神经网络、图嵌入算法、文献引用关系分析、主题建模技术、Transformer架构和稀疏性约束,提出深度引文分析主题模型,挖掘科技文献中的隐含科研主题和知识结构;充分考虑文献间的复杂引用关系和深层次语义关联,克服了传统方法仅关注局部连接的局限性,实现精准的引文预测和科研主题挖掘,能够精准揭示文献中的深层次结构和关系,为科研趋势分析、知识图谱构建和文献推荐等应用场景提供有力支持。