文本相似度确定方法、装置、设备、存储介质及程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本相似度确定方法、装置、设备、存储介质及程序产品
申请号:CN202411917721
申请日期:2024-12-24
公开号:CN119740566A
公开日期:2025-04-01
类型:发明专利
摘要
本申请实施例提供一种文本相似度确定方法、装置、设备、存储介质及程序产品,涉及大数据领域。该方法包括:对第一文本和第二文本进行摘要提取处理,得到第一文本的第一摘要,以及第二文本的第二摘要;对第一文本、第二文本、第一摘要和第二摘要分别进行文本指纹提取处理,得到第一文本的第一指纹、第二文本的第二指纹、第一摘要的第三指纹和第二摘要的第四指纹;根据第一指纹和第二指纹确定第一相似度,以及根据第三指纹和第四指纹确定第二相似度;根据第一相似度和第二相似度,确定第一文本和第二文本之间的文本相似度。本申请实施例提供的方法,提高了文本相似度计算的准确度。
技术关键词
关键词 文本 加权词向量 指纹 摘要 计算机执行指令 权重算法 标识 元素 数字串 矩阵 可读存储介质 计算机程序产品 处理器通信 存储器 模块 大数据 数值