基于NLP语义分割及多级词库的构件标识匹配方法及系统
申请号:CN202510960904
申请日期:2025-07-12
公开号:CN120952000A
公开日期:2025-11-14
类型:发明专利
摘要
基于NLP语义分割及多级词库的构件标识匹配方法及系统,涉及建筑工程信息化领域,该方法包括:建立标准主词库和预设补偿词库,对输入的构件标识进行语义分割,得到分割词元序列,计算分割词元序列与标准主词库中词条的语义相似度和形态相似度,基于语义相似度和形态相似度进行标准术语映射,得到标准术语映射结果;对未完成标准术语映射的分割词元序列利用正则表达式模式进行结构化数据转换,得到结构化数据,对未完成结构化数据转换的分割词元序列进行AI扩展库匹配得到近义词匹配结果;将标准术语映射结果、结构化数据和近义词匹配结果进行组合得到构件标识描述。实施该方法,可以提高工程项目中构件标识名称匹配的准确性。
技术关键词
标识匹配系统
标识匹配方法
语义
术语
序列
形态
计算机程序代码
建筑工程信息化
加权编辑距离
数据
计算机程序产品
模式
项目
深度学习模型
报告
预训练模型
词典
阶段
存储器