基于数据标注规则的大模型标注方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于数据标注规则的大模型标注方法
申请号:CN202510778591
申请日期:2025-06-11
公开号:CN120596535A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及数据处理领域,尤其涉及一种基于数据标注规则的大模型标注方法,包括步骤:基于数据库获取若干待标注数据,并根据待标注数据确定类型信息和标注需求,并根据若干待标注数据创建待标注数据集合;根据类型信息和标注需求构建标注规则集合;根据标注规则集合计算每一待标注数据的匹配度得分向量;根据匹配度得分向量选取匹配度得分最高的标注规则对待标注数据进行标注以获取标准数据。通过构建的标注规则集合,利用计算式计算匹配度得分向量选取匹配度得分最高的规则进行标注,从而提升了对待标注数据进行标注时。
技术关键词
标注规则 标注方法 数据 音频 采样率 文本 停用词表 分词算法 插值算法 样本 滤波算法 图像像素 格式 度函数 视频帧 字符 尺寸