一种文本分类方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文本分类方法、装置、计算机设备及存储介质
申请号:CN202411691671
申请日期:2024-11-22
公开号:CN119577148A
公开日期:2025-03-07
类型:发明专利
摘要
本申请属于人工智能和金融领域,涉及一种文本分类方法,包括对原始文本数据集进行预处理和标注分类标签,得到标注文本数据集,将训练集输入大语言模型进行关键词抽取,得到候选关键词集合,清洗候选关键词集合得到分类关键词集合,基于分类关键词集合构建指令模板,将训练集和指令模板输入大语言模型获得预测分类结果;基于预测分类结果和分类标签之间的损失函数微调大语言模型,得到微调模型,评估微调模型合格后得到文本分类模型,将待分类文本输入文本分类模型进行分类。本申请还提供一种文本分类装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,标注文本数据集可存储于区块链中。本申请能够提高文本分类的准确性和稳定性。
技术关键词
文本分类方法 文本分类模型 大语言模型 计算机可读指令 标签 关键词特征 数据 文本分类装置 训练集 字符串匹配算法 解码网络 计算机设备 模板 注意力机制 语义特征 可读存储介质 区块链技术