摘要
刑事司法案件三元组抽取模型及预测方法,属于自然语言处理领域,用于法律判决预测中的法条预测和罪名预测任务,要点是构建数据集;所述数据集中根据适用法条和/或判决罪名的频率设置频率标签,且低频标签的数据进行数据增强以及外部知识引入;获取当前样本的相似样本;数据集中与当前样本具有相同法条和/或判决罪名的数据为当前样本的相似样本;获取当前样本在数据集中的不相似样本;数据集中与当前样本不具有相同法条和/或罪名的数据,且不具有低频标签的数据为当前样本的不相似样本;将当前样本、相似样本中的任一个,以及不相似样本中的一个组合为当前样本的案例三元组。