摘要
本申请公开了一种文本审核方法及相关装置,涉及自然语言处理技术领域,文本审核方法包括:获取第一目标文本,第一目标文本为大模型的输入文本;确定第一目标文本的风险类别;若第一目标文本的风险类别为有害,输出预设的兜底回复;若第一目标文本的风险类别为无害,将第一目标文本输入大模型;在第一目标文本的风险类别为无害的情况下,还可获取大模型针对第一目标文本回复的文本,作为第二目标文本;确定第二目标文本的风险类别;若第二目标文本的风险类别为有害,则输出预设的兜底回复;若第二目标文本的风险类别为无害,则输出第二目标文本。本申请公开的文本审核方法能够确保大模型输出无害的文本。