用于人机交互的大语言模型训练方法、人机交互方法和人工智能系统

申请号：CN202511175165

申请日期：2025-08-21

公开号：CN120783735A

公开日期：2025-10-14

类型：发明专利

摘要

本公开的实施例提供了一种用于人机交互的大语言模型训练方法、人机交互方法和人工智能系统，涉及人工智能技术领域，方法包括：获得与人机交互相关的训练数据，训练数据中分别标注有数据类型，各数据类型分别对应于垫片内容生成策略或者直接回复。基于训练数据对大语言模型进行训练，使得大语言模型输出的数据类型与标注的数据类型匹配度达到设定条件，于垫片内容和回复生成奖励策略，对大语言模型进行训练，使得大语言模型生成的垫片内容和回复内容达到设定要求，从而提升人机交互性能。

技术关键词

大语言模型语言模型训练方法人机交互方法垫片人工智能系统多轮对话人机交互性能模式策略数据人工智能技术语义样本文本基础