摘要
本发明涉及药店监管技术领域,具体涉及一种不规范药店名称的识别方法,识别步骤为:在计算机中构建规则库,规则库内包括有药店命名的标准规范;获取不规范药店名称样本集,对样本集进行词频分析,得到样本集中高频率的词汇,将获取的词汇添加在规则库内,完善规则库,分为初步筛选规则与深入筛选规则;基于自然语言处理模型,将待识别的药店名称与初步筛选规则输入模型内。本申请通过对药店名称进行初步识别判断,初步识别能识别筛选出市面上大众的不规范药店名称,而对于一些小众的药店名称基于决策树来进行深入识别,筛选出不规范的药店名称,能够降低人工识别检测的劳动强度,并且提升了识别判断的准确率。