一种基于大语言模型的建筑行业物料分类与属性抽取方法
申请号:CN202411898504
申请日期:2024-12-23
公开号:CN119378553B
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于大语言模型的建筑行业物料分类与属性抽取方法,包括基于标准分类体系数据集与全品类数据集构建传统数据库和向量数据库;输入不规则文本,基于大语言模型采用标准分类名称向量数据库、标准分类样本向量数据库、全品类分类名称向量数据库和全品类分类样本向量数据库对不规则文本进行检索,得到检索信息;基于大语言模型对检索信息进行初步匹配和二次匹配,得到物料分类名称;基于大语言模型从传统数据库中对物料分类名称进行属性抽取,得到物料属性。本发明利用大语言模型的语义理解能力与信息检索机制整合多源数据,实现了高效准确的物料分类与属性抽取。
技术关键词
属性抽取方法
大语言模型
样本
文本
数据
定义
信息检索
模板
标志
语义
机制