一种网络文本数据的热点获取方法和热点热度分析方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种网络文本数据的热点获取方法和热点热度分析方法
申请号:CN202411953534
申请日期:2024-12-27
公开号:CN119862279A
公开日期:2025-04-22
类型:发明专利
摘要
本发明提供一种网络文本数据的热点获取方法和热点热度分析方法,包括依据热点规则过滤网络数据,提取与热点相关的若干数据元;数据元分词处理以获取特征词,依据特征词生成数据元向量;基于聚类策略确定数据元向量的内若干聚类中心,合并相似聚类中心以确定类中心,以类中心表示热点,所述所述数据元包括文本特征和非文本特征。本发明通过将数据元内多角度数据融合至一个数据元向量内,提高热点发现的准确性。
技术关键词
热点获取方法 热度分析方法 文本 数据 网络 初始聚类中心 语种识别 翻译模型 关键词 分词 策略 自然语言 因子 帖子 多角度 主题 语义 阻尼