一种无监督汉词语消歧方法、装置、终端设备及存储介质
申请号:CN202510022895
申请日期:2025-01-07
公开号:CN119962540B
公开日期:2025-08-19
类型:发明专利
摘要
本申请公开了一种无监督汉词语消歧方法、装置、终端设备及存储介质。本申请对用户输入的文本数据进行文本分割,获取若干词语,并依次提取各所述词语的多层特征;多层特征包括:第一语义层特征;对各所述词语的所述第一语义层特征进行迭代更新,每次更新时,根据各词语的多层特征,更新预设的语义图谱,以更新各词语对应节点的第一融合特征;并将第一融合特征输入至预训练完毕的消歧模型中,获取对应词语的第二语义层特征,以更新对应节点的第一语义层特征;直至各词语对应前后获取的第二语义层特征之间的第一余弦相似度小于预设值,根据当前获取的第二语义层特征,确定对应词语的语义表示。通过本申请,可以提高语义图谱以及消歧结果的准确性。
技术关键词
词语消歧方法
语义图谱
融合特征
节点
无监督
向量空间模型
样本
文本
特征提取模块
多层特征融合
情感分析技术
可读存储介质
终端设备
标注工具
计算机
处理器
数据