基于大语言模型的中医古籍症状标准化处理方法

申请号：CN202511088093

申请日期：2025-08-05

公开号：CN120579560B

公开日期：2025-10-21

类型：发明专利

摘要

本发明属于自然语言处理技术领域，公开了基于大语言模型的中医古籍症状标准化处理方法，包括：获取并预处理中医古籍文本，提取初始症状表述；针对初始症状表述中存在的复合症状，采用预设规则引擎及大语言模型相结合的方式进行拆分，得到单一症状表述；基于预设的标准症状词库，计算单一症状表述的多维相似度；对多维相似度进行加权融合得到综合相似度得分，基于综合相似度得分从标准症状词库中确定一个对应的标准症状，将其作为初始症状表述的标准化表达。本发明通过多维度的校验机制，能够有效克服因“同症异名”、用词习惯差异等造成的匹配失败问题，其准确性和鲁棒性远超仅依赖单一语义匹配的现有技术。

技术关键词

预训练语言模型大语言模型机器翻译模型文本语义计算方法标注规则预训练模型校验机制术语自然语言鲁棒性数据身体词典编辑习惯符号模板