奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品
奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。
来自主题: AI技术研报
5925 点击 2025-04-01 09:49
搜索
为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。
AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中,所有顶尖LLM通过率不超过10%,而且模型都表现得过度自信。
测试结果显示出想开发出能与人类计算机操作能力相仿的AI,还存在很大挑战。