摘要
本发明涉及技术领域,特别涉及一种基于自然语言处理的文本智能分析方法与系统。该基于自然语言处理的文本智能分析方法,利用爬虫技术爬取对应网站数据,进行数据清洗,清除文本噪音,并规范数据格式,对文本进行真实数据填充;以双向编码器表示变换BERT为基石,结合双向长短期记忆网络BiLSTM与条件随机场CRF,构建命名实体识别模型;训练命名实体识别模型,加载训练后的模型,对新输入文本进行命名实体识别,输出实体及其类别标签。该基于自然语言处理的文本智能分析方法与系统,能够自动化提取关键信息,不仅提高了处理效率,而且提升了关键信息提取的准确率,降低人为错误的风险,拓展了应用范围,改善了用户体验。