Gemini 3仅得33.6分!清华发布首个「约束流形」空间智能基准
Gemini 3仅得33.6分!清华发布首个「约束流形」空间智能基准SSI-Bench是首个在约束流形中评估模型空间推理能力的基准,强调真实结构与约束条件,通过排序任务考察模型是否能准确理解三维结构的几何与拓扑关系,揭示当前大模型在空间智能上严重依赖2D信息,实际表现远低于人类。研究指出,模型需提升三维构型识别和约束推理能力,才能真正理解空间问题。
来自主题: AI技术研报
8874 点击 2026-02-25 14:33