基于词权重融合与文档对比的无监督抽取式摘要生成方法
申请号:CN202511202808
申请日期:2025-08-27
公开号:CN120705309B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及一种基于词权重融合与文档对比的无监督抽取式摘要生成方法,包括:获取由文档组成的集合,采用句子编码器对文档中的句子进行嵌入,得到句子的向量表示;采用词权重动态评估法评估单词在句子中的重要性;采用词权重静态评估法评估单词在句子中的重要性;对两方法的评估结果进行融合;采用基于度中心性的图算法来提取句子的重要性,得到每个文档中句子的显著性得分,并筛选得分最高的多个句子作为候选句子,得到候选句子矩阵;计算每个候选句子与其他候选句子的余弦相似度,以构建正例和反例进行对比学习;采用余弦退火策略来动态调整对比学习的温度。与现有技术相比,本发明有效提升了无监督抽取式文本摘要性能。
技术关键词
摘要生成方法
退火策略
动态
频率
打分器
编码器
表达式
矩阵
无监督
线性
算法
节点
语义
文本
阶段
基础
模块
数据