一种基于微调BERT模型的单个英文专利文本关键词提取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于微调BERT模型的单个英文专利文本关键词提取方法
申请号:CN202510255026
申请日期:2025-03-05
公开号:CN120106069A
公开日期:2025-06-06
类型:发明专利
摘要
本发明公开了一种基于微调BERT模型的单个英文专利文本关键词提取方法,该方法利用大规模英文专利文本及其关键词对BERT模型进行微调,使其能够精准识别单个英文专利文本中的关键词,具体步骤包括:输入大规模英文专利文本及其关键词;对每个专利文本进行预处理并标记;使用标记数据对BERT模型进行微调,使其能够通过NER任务识别关键词;输入单个英文专利文本,对其进行预处理并利用微调后的BERT模型进行NER任务,生成每个单词的类别判断;通过后处理步骤,确定最终的关键词集合,本发明结合BERT模型的强大语义理解能力和NER任务的精准识别能力,提高了单个英文专利文本关键词提取的准确性,能够有效支持专利信息检索和分析。
技术关键词
BERT模型 文本关键词提取 标记 信息检索 命名实体识别 语义向量 语义特征 摘要 数据 字典 分词 字符 冗余 分段 形态 序列