一种基于电网客服大模型的数据生成方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于电网客服大模型的数据生成方法及相关装置
申请号:CN202510784820
申请日期:2025-06-12
公开号:CN120670849A
公开日期:2025-09-19
类型:发明专利
摘要
本发明属于数据生成技术领域,提供一种基于电网客服大模型的数据生成方法及相关装置,所述方法包括:获取原始语句作为数据集,对数据集进行预处理,得到预处理后的数据集;对预处理后的数据集进行数据增强,得到数据增强后的数据集;将增强后的数据集通过语义约束和指标约束生成文本语句;将文本语句和原始语句作为深度神经网络的输入,输出文本语句和原始语句的相似度,根据相似度筛选出新语句作为数据集的新数据。本发明以生成高质量、符合实际应用需求的数据,降低数据获取成本,提升模型的鲁棒性和泛化能力,从而增强其在实际应用中的稳定性和高效性。
技术关键词
语句 数据生成方法 数据生成系统 客服 文本 语义 同义词 优化深度神经网络 数据处理工具 预训练语言模型 模拟键盘 数据生成技术 数据获取模块 指标 输出模块 字符 可读存储介质 噪声