基于特征工程的智能海关商品归类模型及其建立方法和应用
申请号:CN202411615997
申请日期:2024-11-13
公开号:CN119739860A
公开日期:2025-04-01
类型:发明专利
摘要
本发明公开了一种基于特征工程的智能海关商品归类模型的建立方法,包括根据商品规范申报目录梳理目标税号的归类特征要素;使用正则表达式对特征做初步提取;人工校正和标注程序提取的特征;对特征进行数字化标注;将Bert和CRF结合,构建人工智能训练模型并使用标注数据开展特征识别训练;对训练结果进行评估,直到识别准确率达标,停止训练;使用Bert模型作为基座进行训练,选择合适的损失函数、定义梯度更新策略,设计训练循环与停止策略,并采用早停等技术防止过拟合,提升模型的泛化能力。本发明不仅可保证较高的查全率和查准率,其算法和流程设计保持了对算力的较低要求,实测显示8G显存即可满足要求,并且推理速度达到每小时15‑18万条。
技术关键词
特征工程
标签编码器
数据
语义特征
样本
正则化技术
文本
CRF模型
字典结构
机器学习模型
特征提取器
策略
数字型
目录
处理器
调度器
序列
定义
优化器