一种基于自监督学习的大模型初中英语完形填空生成方法
申请号:CN202410854577
申请日期:2024-06-28
公开号:CN118673911B
公开日期:2024-12-13
类型:发明专利
摘要
本发明公开了一种基于自监督学习的大模型初中英语完形填空生成方法,包括S1、收集英语文本数据作为训练数据集及各省市10年内中考完形填空真题作为文本改编学习数据集;S2、形成出题词汇表;S3、并对训练数据集进行预处理;S4、使用自监督学习方法构建大规模自然语言处理模型;S5、根据训练数据集及文本改编学习数据集对大规模自然语言处理模型进行任务微调;S6、基于训练好的大规模自然语言处理模型及改编后的文本自动生成初中英语完形填空题目;S7、对生成的完形填空题目进行自动校验和人工审核;S8、将生成的完形填空题目存储在题库中。本发明利用自监督学习和大规模自然语言处理模型,高效地生成大量完形填空题目,极大地节省了人力和时间成本。
技术关键词
自然语言
文本段落
监督学习方法
初中英语教学
样本
生成方法
英语教材
噪声数据
初中生
标注算法
分词算法
单元机
定义
度函数
标签