一种基于大语言模型的电网调控文本数据标注方法与系统
申请号:CN202510110134
申请日期:2025-01-23
公开号:CN120104799A
公开日期:2025-06-06
类型:发明专利
摘要
本发明提出了一种基于大语言模型的电网调控文本数据标注方法与系统。该方法针对非结构化电网文本数据,设计了一种从数据预处理到语义解析、标注生成与问答生成的完整流程。通过引入大语言模型的语义理解能力,系统能够高效提取文本中的关键内容,并生成精准的标注和智能问答。实验表明,该方法在文本标注的准确性和效率上显著优于传统方法,尤其适用于电网调控指令、操作日志等大规模文本数据的处理需求。
技术关键词
数据标注方法
大语言模型
数据标注系统
关键词
大规模文本数据
筛选算法
语义向量
聚类算法
语句
摘要技术
文档分类
深度学习模型
评分机制
标识符
关系
日志