基于文本信息的关键词分类方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于文本信息的关键词分类方法、装置、设备及存储介质
申请号:CN202510227917
申请日期:2025-02-27
公开号:CN120067334A
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开一种基于文本信息的关键词分类方法、装置、设备及存储介质,涉及计算机技术领域,该方法包括:获取原始文本信息,利用预设语言模型对至少一条文本进行评分,对至少一条文本进行择优筛选,得到一条或多条目标文本;利用预设模型计算一条或多条目标文本对应的至少一个嵌入向量,并将至少一个嵌入向量输入至文本处理算法进行语义相似度评估,得到至少一个关键词,以及每个关键词与目标文本之间的对应关系;通过聚类算法对至少一个关键词分类,生成关键词摘要和对一条或多条目标文本的分类结果。本方法通过嵌入向量计算词语间的语义相似度,更准确地捕捉文本间的细微语义差异,从而提取出与文本内容高度相关的关键词,提高准确性和相关性。
技术关键词
关键词分类方法 文本处理算法 语义 聚类算法 词语 生成关键词 关系 可读存储介质 摘要 存储计算机程序 排序算法 身份证号 分类装置 处理器 计算机设备 字符 冗余 模块