摘要
本发明提出了一种人工智能医疗主题流行度预测方法及系统,涉及自然语言处理和时间序列预测技术领域,针对的问题是:现有技术聚类离散性、划分主题区分度低、主题词描述代表性差;预测模型单一、缺乏动态权重调整,预测精度低。该方法获取医疗平台用户评价文本数据,对其进行预处理,得到医患两类标签数据;通过改进的BERTopic模型分别对医患两类标签数据进行动态主题建模,得到聚类主题分布和主题关键词分布,构建并优化主题流行度公式;得到主题流行度得分序列,利用训练好的主题流行度预测模型进行预测,得到预测结果。本发明解决了现有技术存在的问题,有效应对文本线性波动与非线性特征的复杂变化,提升预测精度与稳定性。