一种文档复合标签的生成方法、装置、设备以及存储介质
申请号:CN202510175761
申请日期:2025-02-18
公开号:CN120106013A
公开日期:2025-06-06
类型:发明专利
摘要
本发明公开了一种文档复合标签的生成方法、装置、设备以及存储介质,所述方法包括:生成目标文档主题对应的主题标签相似度矩阵;生成对应的用户标签相似度矩阵;生成对应的用户协同相似矩阵和主题协同相似矩阵;将用户协同相似矩阵和主题协同相似矩阵输入至一预设的复合标签抽取TagDC模型,以使得复合标签抽取TagDC模型根据用户协同相似矩阵和主题协同相似矩阵,生成每个目标文档的多标签置信概率列表,输出每个目标文档的多标签置信概率列表;根据多标签置信概率列表,从多标签置信概率列表中选取若干标签组合生成目标文档的复合标签。通过本发明可以生成目标文档的复合标签,提高电力文档标签的覆盖度和准确性。
技术关键词
复合标签
多标签
标签知识库
主题数据库
列表
生成方法
矩阵
关键词
生成装置
模块
新词
文本
处理器
存储器
算法
电子设备
计算机
电力