基于大语言模型的科技报告技术社区语义解析方法及系统
申请号:CN202510683779
申请日期:2025-05-26
公开号:CN120542542A
公开日期:2025-08-26
类型:发明专利
摘要
本申请涉及自然语言处理和机器学习技术领域,公开了基于大语言模型的科技报告技术社区语义解析方法及系统,方法包括以下步骤:从技术社区实时采集数据,构建动态数据集;将构建的动态数据集输入至动态知识蒸馏器中,得到更新后的大语言模型;对数据分别进行多模态嵌入编码;生成多粒度的初步注意力权重分布,并据此得到初步语义解析结果;将所述分层强化信号输入至门控调节机制中;构建结构化知识图谱并输出作为最终语义解析结果。本发明采用基于动态知识蒸馏和增量式参数更新的技术方案,达到了能够实时优化大语言模型的效果,使得模型能够在技术社区中应对动态发展的数据,提供更加精准的语义解析。
技术关键词
语义解析方法
大语言模型
动态数据集
分层注意力
多模态
图表
报告
科技
掩码矩阵
文本
蒸馏器
跨模态
社区平台
注意力机制
多源数据融合技术
关系