
首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科”
首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科”模型胡乱论证“1+1=3”,评测系统却浑然不觉甚至疯狂打Call?是时候给奖励模型打个分了!
来自主题: AI技术研报
6751 点击 2025-05-10 17:13
模型胡乱论证“1+1=3”,评测系统却浑然不觉甚至疯狂打Call?是时候给奖励模型打个分了!
AI竟能精准模拟博士生资格考试?只需将评委的履历和论文输入ChatGPT,就能创建数字形象,模拟面试问题,顺利通过考试。
自打AI可以生成图片后,“美女”就成了主题之一。“她们”初看惊艳,但时间久了,你就发现人类在用AI塑造女性形象时,审美也是十分单一。这些AI打造的女性形象个个皮肤完美、身材出众。