摘要
本发明提供了一种基于大模型的文本热点聚类方法,包括:利用大语言模型对待处理文本数据以总结的方式得到文本的摘要输出;基于大语言模型对文本摘要按领域进行划分得到分类标签;基于大语言模型对文本摘要进行要素提取得到要素信息;将文本摘要作为输入使用向量嵌入模型得到语义向量输出;将原始文本属性、文本摘要、分类标签、要素信息和语义向量存入向量库;按照业务需求形成检索条件从向量库中召回文本候选集;根据文本候选集,利用阶段最优聚类算法得到聚类结果,将各类簇的文本摘要集合作为输入,基于大语言模型得到热点摘要总结,整合成为最终热点结果。本发明方法能够提高大规模动态文本数据分析的效率和准确度。