一种基于向量数据库的高频输入问题实时统计方法及系统
申请号:CN202411665553
申请日期:2024-11-20
公开号:CN119782496A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供了一种基于向量数据库的高频输入问题实时统计方法及系统,在面对多种多样的文本输入有着较好的适应性和运算效率,有效避免了聚类算法运行时间长、占用资源大的问题和类别数目预设对聚类算法的影响;面对高维文本数据向量时可以用极低的内存资源,有着较高的聚类效率,同时也提高了聚类算法的稳定性;能够自动化的基于语义高维信息进行高准确率的聚类,保证有较高的统计效率;本发明充分利用大语言模型的总结能力对领域内的多个输入文本进行总结,基于此方法获得的高频问题有着较高的代表性以及专业性;本发明可实时统计不同时间段的高频问题,若需要重新聚类无需进行重复的聚类操作,提升了高频问题统计的统计自由度与统计效率。
技术关键词
文本
编码向量
统计方法
语义
排序模型
时间段
列表
统计系统
大语言模型
编码模块
输入模块
算法
资源
聚类
日期
内存
数据