基于语言模型的运价数据智能解析方法、装置及存储介质
申请号:CN202510939406
申请日期:2025-07-08
公开号:CN121031568A
公开日期:2025-11-28
类型:发明专利
摘要
本发明提供了一种基于语言模型的运价数据智能解析方法、装置及存储介质,涉及人工智能与自然语言处理技术领域,该方法包括:首先采用文档解析器对原始数据进行预处理并生成标准化结构文档;其次利用预训练嵌入模型构建Milvus向量数据库的历史数据映射关系;进而通过文档/字段双维度任务拆解生成语义检索子任务,结合向量数据库检索结果形成大语言模型输入;随后采用多线程异步推理引擎完成子任务解析;最终将解析结果组装为结构化JSON数据返回前端。本方法创新性地融合了语义检索与大模型推理能力,通过任务分解和向量检索增强技术,显著提升了运价数据解析的准确性和处理效率。
技术关键词
国际运价数据
智能解析方法
搜索工具
解析器
语义
文本
样本
格式
多线程
字段
大语言模型
基础
数据预处理方法
标准化结构
检索策略
关系
异步方式
遍历算法
组装模块