基于小模型引导的水产养殖疾病防控文本数据增强方法、设备及存储介质
申请号:CN202510349966
申请日期:2025-03-24
公开号:CN120277217B
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供了一种基于小模型引导的水产养殖疾病防控文本数据增强方法、设备及存储介质,属于文本数据增强领域。该方法基于优质语料+预训练大模型+prompt的策略,引导模型生成符合需求的数据;引入了一种小模型监督大模型方法,结合小模型与强化学习技术,利用小模型捕捉文本中的语义信息,通过强化学习机制根据小模型的反馈不断动态调整大模型的生成策略,提高了生成数据的相关性,还增强了数据的多样性;此外,设计了除噪整合模块,利用小模型负责评估和筛选大模型生成的数据,识别并排除不符合要求或包含噪声的数据,从而提升整体数据集的质量。本发明生成的文本不仅在语义上与原始数据保持高度一致,同时还显著增加了数据的丰富性。
技术关键词
水产养殖疾病防控
水产生物疾病
文本
实体
样本
数据标注方法
强化学习技术
电子设备
强化学习方法
切片
参数
数据嵌入
框架
核心
格式
策略
处理器