用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住? 用「进化+压力测试」自动生成的竞赛级编程题,各家大模型谁更hold住? 关键词: AI,模型训练,UniCode,模型压力测试 在当前评测生成式模型代码能力的浪潮中,传统依赖人工编写的算法基准测试集,正日益暴露出可扩展性不足与数据污染严重两大瓶颈。 来自主题: AI技术研报 6732 点击 2025-10-29 10:03