一种RAG赋能下的海运邮件缩略语动态知识库构建与嵌入方法
申请号:CN202510548464
申请日期:2025-04-28
公开号:CN120561263A
公开日期:2025-08-29
类型:发明专利
摘要
本发明提供一种RAG赋能下的海运邮件缩略语动态知识库构建与嵌入方法,包括构建缩略语知识库;将缩略语知识库进行动态更新;将缩略语知识库嵌入至邮件分析系统;其中:构建缩略语知识库包括数据清洗、向量生成和数据存储,即从原始海运业务邮件中提取有价值的语义片段及缩略语,过滤无用信息,进行字符级去重与标准化;缩略语及其上下文生成语义向量,以便进行相似度检索;将清洗后的数据和生成的向量存储于支持向量检索的知识库存储方案中;将缩略语知识库嵌入至邮件分析系统,采用RAG架构,根据输入的缩略语,在知识库中检索最相关的全称解释及其上下文定义;基于检索结果,将信息准确映射到预定义字段上,进行语义解析与格式标准化,完成结构化输出。
技术关键词
嵌入方法
支持向量检索
语义向量
动态更新
数据存储
分析系统
字符
存放邮件
动态规划算法
存储桶
BERT模型
识别策略
阶段
格式
词典