一种天气预报服务文本数据集生成方法、系统及相关装置
申请号:CN202510055944
申请日期:2025-01-14
公开号:CN119476449B
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种天气预报服务文本数据集生成方法、系统及相关装置,属于气象数据处理技术领域。该方法包括:采集天气预报服务数据;对天气预报服务数据进行预处理,得到天气预报服务文本数据;基于大语言模型,对天气预报服务文本数据进行扩展,得到天气预报服务文本扩展数据集;采用大语言模型和定量评估算法相结合的方式,对天气预报服务文本扩展数据集进行检验评估;将天气预报服务文本扩展数据集中满足检验评估的数据构建得到天气预报服务文本数据集。该方法可以实现天气预报服务文本数据集的半自动化构建,有效提升了数据集的生成效率。
技术关键词
天气预报服务
文本
大语言模型
生成方法
评估算法
气象数据处理技术
代表
数据切片方法
指示计算机执行
计算机程序产品
存储结构
网络爬虫技术
标注算法
面向公众
可读存储介质
语义结构
处理器
网络平台