摘要
本发明属于自然语言处理技术领域,公开了基于大语言模型的中医古籍症状标准化处理方法,包括:获取并预处理中医古籍文本,提取初始症状表述;针对初始症状表述中存在的复合症状,采用预设规则引擎及大语言模型相结合的方式进行拆分,得到单一症状表述;基于预设的标准症状词库,计算单一症状表述的多维相似度;对多维相似度进行加权融合得到综合相似度得分,基于综合相似度得分从标准症状词库中确定一个对应的标准症状,将其作为初始症状表述的标准化表达。本发明通过多维度的校验机制,能够有效克服因“同症异名”、用词习惯差异等造成的匹配失败问题,其准确性和鲁棒性远超仅依赖单一语义匹配的现有技术。