一种面向低资源短文本分类的大模型蒸馏方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向低资源短文本分类的大模型蒸馏方法和系统
申请号:CN202411952513
申请日期:2024-12-27
公开号:CN119862939A
公开日期:2025-04-22
类型:发明专利
摘要
本发明提出一种面向低资源短文本分类的大模型蒸馏方法和系统。其中,方法包括:利用同一大模型,根据多步提示方法,建立语义句法增强思维链和领域知识思维链;应用语义句法增强思维链提取短文本中的关键概念,通过关键概念检索短文本的常识知识,根据常识知识输出融合语义和句法推理知识后的改进文本;应用领域知识思维链,提取短文本中的基本概念,通过基本概念,生成领域知识;通过短文本分类任务、改进文本为模型输出的语义与句法推理任务和领域知识为模型输出的领域知识提取任务,对小模型进行训练。本发明提出的方案能够节约硬件资源,适应更多应用场景;提高分类精度,支持无重训练的推理;思维链设计提升推理和涌现能力。
技术关键词
模型蒸馏方法 融合语义 概念 提示方法 文本 节约硬件资源 可读存储介质 蒸馏系统 标签 指令 电子设备 处理器 模块 存储器 计算机 场景 精度