摘要
本发明公开了一种热门话题簇生成方法、装置、设备、介质及产品,该方法包括:获取满足采集条件的新闻数据集;对新闻数据集中的新闻数据进行话题建模聚类,得到各新闻数据所属的话题簇集;对话题簇集进行分裂及合并,确定候选话题簇;基于大模型及候选话题簇,确定最终热门话题簇。通过在话题簇合并前进行分裂处理,确保每个话题簇内新闻的高度一致性,避免了将不相关或只有微弱关联的新闻错误地归入同一话题簇,从而提高了最终热门话题簇中话题的准确性和纯净度,基于大模型确定最终热门话题簇的标题,提高了标题的质量,进而提高了最终热门话题簇的质量。