蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛
6001点击    2025-07-06 15:40

又一个让大模型几乎全军覆没的难题出现了。


注意看,这张图画的是谁?


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


如果不够明显,那再眯着眼睛看呢。没错,就是蒙娜丽莎。


这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。


ChatGPT只能分辨出这是一张脸。。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


Gemini则是直接识别错了人。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


网友:懂了,大模型不会眯眼睛。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


大模型不会眯眼睛?


为了验证这一推论,咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来,那给一点提示,让它可以尝试眯着眼睛。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


首先来看ChatGPT的表现。


它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部轮廓,结果在最后关头识别错了。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


而再让它深度思考一下,答案给不出来了。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


Gemini的回答则还停留在各种颜色的条纹,也辨认出这是个侧脸的轮廓。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


Grok则直接表示无法辨认,让我提供一张更清晰的照片,emmm…


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


再来看看国产玩家的表现,还是挑出三个来看看。


豆包的回答与Gemini类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。


但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????


可能这蓬松的长发不是一个类型的吧。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B,在完成深度思考之后,它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


而元宝、讯飞的回答如下:


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


元宝


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


讯飞星火


但o3-Pro一次性回答对


不过在一众模型全军覆没之际,也还是有得分选手。


比如o3-Pro


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3(非pro版)思考链路里,它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


但有人怀疑了,它是不是用搜索了。


不过这被发现者驳回了。首先o3也可以用搜索,但无法做到这一点。而且从o3-pro的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问“这是什么?”,它也不起作用。


还有尝试了三次的GPT-4o


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


不过这合理怀疑,只是它偶然猜对了。


因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


又或者让o4-mini-high先人为地模糊图像以使其“眯眼”,然后就能识别图像。


蒙娜丽莎让大模型们几乎全军覆没!网友:懂了,AI不会眯眼睛


好了,感兴趣的朋友可以去尝试一下。有挑战成功的友友,可以在评论区分享下提示词经验~


参考链接:


[1]https://x.com/svpino/status/1940924964431188137


[2]https://x.com/goodside/status/1941296192656376297


文章来自于微信公众号“量子位”。


关键词: AI , 模型测试 , 人工智能 , chatGPT
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0