一种大模型微调数据的获取方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大模型微调数据的获取方法、装置、设备及存储介质
申请号:CN202411913886
申请日期:2024-12-24
公开号:CN119829718A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了一种大模型微调数据的获取方法、装置、设备及存储介质。首先基于待调整模型的应用领域、训练问题、原始训练数据文档及文档提示词生成输入指令,并输入到具有反思机制的语言生成模型中,以生成多个问答结果。其中,文档提示词用于指示生成要求。再从问答结果中确定候选结果,并从原始训练数据文档中提取目标向量分句。通过计算候选结果与目标向量分句的相似度并进行阈值判断,筛选出符合条件的目标结果。最后将目标结果与训练问题组合成问答对,形成大模型微调数据。本申请通过文档提示词指导答案生成,并结合反思机制生成多个问答结果,通过相似度匹配筛选最佳答案,从而确保作为目标结果的问答结果全面、准确且符合需求。
技术关键词
数据 指令输入单元 语句 滑动窗口 文本 答案 可读存储介质 终端设备 排序模型 机制 处理器 语义 存储器 计算机 标记 定义