一种基于机器学习和ES词云统计的智能化词云展示方法及系统
申请号:CN202510368751
申请日期:2025-03-27
公开号:CN119884362A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开一种基于机器学习和ES词云统计的智能化词云展示方法,属于词云生成技术领域;该方法包括:获取待处理文本数据;预处理得到预处理后文本数据;特征提取得到关键词;统计得到词频;统计得到逆文档频率;根据词频和逆文档频率,得到基础权重;根据关键词的上下文,得到调整因子;根据基础权重和调整因子,得到权重;生成词云。本发明利用ES强大的文本检索和分析能力,快速的对海量文本数据进行词频统计、情感分析、主题分类等处理,对文本进行快速分析和处理。从而实现对文本内容的全面分析和可视化呈现,提高词云展示的表现力和可解释性,为用户提供更加智能化、高效和简易的文本可视化工具。
技术关键词
展示方法
关键词
因子
海量文本数据
文本可视化
分词
生成算法
基础
频率
机器学习算法
词频统计
特征提取模块
展示系统
生成技术
自然语言
主题
字符