负样本构建、模型训练方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
负样本构建、模型训练方法及设备
申请号:CN202510115808
申请日期:2025-01-23
公开号:CN120011551A
公开日期:2025-05-16
类型:发明专利
摘要
本申请实施例提供一种负样本构建、模型训练方法及设备。该方法包括:获取正样本集合,其中,正样本集合包括多个正样本,每一正样本包括查询语句和查询语句的关联文本;将正样本集合中的任一正样本作为目标正样本,对于每一其余正样本,计算目标正样本的目标查询语句和目标关联文本中至少一个与该其余正样本的查询语句和关联文本各自的相似度;将相似度大于等于预设阈值的至少一个其余正样本作为候选样本,提取每一候选样本中的关联文本作为第一文本,构建包括第一文本与目标查询语句的第一负样本,得到第一负样本集合。上述第一负样本与正样本之间的区分度较小,使用上述负样本训练后的模型具有更高的检测精度和更好的泛化能力。
技术关键词
样本 文本 语句 计算机执行指令 三元组 阶段 模型训练方法 自然语言模型 微调单元 处理器 模型训练设备 存储器 模型训练装置 可读存储介质 计算机程序产品 精度
系统为您推荐了相关专利信息
语句 抽象语法树 语义 计算器 数据类型信息
指数 光谱成像 回弹 开口面积 边坡
动作生成方法 人体关节点 文本 编码器 身体
样本 训练集数据 网络流量分类方法 弱分类器 特征选择
优化对齐方法 批量 样本 非暂态计算机可读存储介质 表达式