首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科” 首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科” 关键词: AI,RM-BENCH,AI评测,人工智能 模型胡乱论证“1+1=3”,评测系统却浑然不觉甚至疯狂打Call?是时候给奖励模型打个分了! 来自主题: AI技术研报 6618 点击 2025-05-10 17:13