一种基于多源文本的动态热点线索精准提取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多源文本的动态热点线索精准提取方法
申请号:CN202411829909
申请日期:2024-12-12
公开号:CN119719342A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种基于多源文本的动态热点线索精准提取方法,通过动态标签配置和Prompt设计结合轻量化微调技术(RsLoRA),实现敏感情报识别模型的实时适配和高效训练,在多变情报场景中无需重新训练即可精准识别。通过人类反馈强化学习(PPO)和排序训练,优化生成式大模型输出的线索文本,精准提取事件主体与内容,生成结果结构化且高度概括。结合语义向量模型和动态多层DBSCAN聚类算法,克服现有聚类算法对语义密度差异场景的适应性不足问题,实现高精度线索聚合和热度统计。整体方案通过RsLoRA技术降低资源消耗和训练时间,综合提升情报处理效率与分析能力,在智慧公安、政府管理等领域具备显著的技术优势和广泛的应用前景。
技术关键词
精准提取方法 线索 文本识别模型 语义向量 动态 热点 智慧公安 事件主体 互联网舆情 生成训练样本 场景 语义关联度 标签 命名实体识别 强化学习算法 微调技术 生成事件 聚类