一种基于微调BERT模型的单个英文专利文本关键词提取方法
申请号:CN202510255026
申请日期:2025-03-05
公开号:CN120106069A
公开日期:2025-06-06
类型:发明专利
摘要
本发明公开了一种基于微调BERT模型的单个英文专利文本关键词提取方法,该方法利用大规模英文专利文本及其关键词对BERT模型进行微调,使其能够精准识别单个英文专利文本中的关键词,具体步骤包括:输入大规模英文专利文本及其关键词;对每个专利文本进行预处理并标记;使用标记数据对BERT模型进行微调,使其能够通过NER任务识别关键词;输入单个英文专利文本,对其进行预处理并利用微调后的BERT模型进行NER任务,生成每个单词的类别判断;通过后处理步骤,确定最终的关键词集合,本发明结合BERT模型的强大语义理解能力和NER任务的精准识别能力,提高了单个英文专利文本关键词提取的准确性,能够有效支持专利信息检索和分析。
技术关键词
BERT模型
文本关键词提取
标记
信息检索
命名实体识别
语义向量
语义特征
摘要
数据
字典
分词
字符
冗余
分段
形态
序列