限定120分钟科研挑战,o1和Claude表现超越人类
限定120分钟科研挑战,o1和Claude表现超越人类2小时内,Claude和o1就能超过人类专家平均科研水平。
来自主题: AI技术研报
8885 点击 2024-11-25 13:57
搜索
2小时内,Claude和o1就能超过人类专家平均科研水平。
大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。 不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的。