一种基于大模型的文本热点聚类方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的文本热点聚类方法
申请号:CN202411536287
申请日期:2024-10-31
公开号:CN119474387A
公开日期:2025-02-18
类型:发明专利
摘要
本发明提供了一种基于大模型的文本热点聚类方法,包括:利用大语言模型对待处理文本数据以总结的方式得到文本的摘要输出;基于大语言模型对文本摘要按领域进行划分得到分类标签;基于大语言模型对文本摘要进行要素提取得到要素信息;将文本摘要作为输入使用向量嵌入模型得到语义向量输出;将原始文本属性、文本摘要、分类标签、要素信息和语义向量存入向量库;按照业务需求形成检索条件从向量库中召回文本候选集;根据文本候选集,利用阶段最优聚类算法得到聚类结果,将各类簇的文本摘要集合作为输入,基于大语言模型得到热点摘要总结,整合成为最终热点结果。本发明方法能够提高大规模动态文本数据分析的效率和准确度。
技术关键词
语义向量 聚类方法 大语言模型 摘要 热点 聚类算法 矩阵 计算方法 字符 阶段 索引 文本编码器 标签 序列 格式 数据