前几天在论坛上看别人激烈辩论 AI 是否会取代工程师,突然有人在回复中冷不丁的抛出一个评论:
别说那么多废话,先让 AI 画个左撇子出来。
这是个什么问题?
我第一直觉对这个表示怀疑,强如 GPT-4o,连刘强东都能画的和真的一样,怎么会画不出来左撇子。
但在好奇心的驱使下,我还真的试了一下,发现这个问题没这么简单。
提示词很简单:
“画左撇子喝水的图”
这一上来,就失败的干干脆脆。
有没有可能是偶发?我又多试了几次:
果然是稳定的失败。
好好好,Gemini 也不行.
那目前最强的 GPT4o 总没问题吧?
没想到 GPT4o 也不行,真的是打了我的脸.
外国 AI 不行,我们再来看看国内的:
试了好几次,都是这个效果,只能说:
即梦偶尔有概率生成左手拿杯子的,但也就是非常“偶尔”而已。
整体来说,目前我们能接触到的 AI 绘图工具,在这个项目上几乎全军覆没。这是我万万没想到的。
这个“离谱”的测试结果,会不是因为“左撇子”表述有歧义,“喝水”这个项目是个特例?
为了消除这两个怀疑,我重新构建了提示词:
“画一个用左手握笔写字的人。”
大家直接看结果:
上面分别为 Grok,GPT4o 和豆包,全军覆没。
其它模型结果我就不贴了,结论也是一样。
那是不是 AI 分不出左右?
用下面的图进行测试,让 AI 回答下图是哪个手。
上面三张图分别是 Grok,Gemini 和豆包,确实是左右都分不清。
只有 GPT-4o 答对了。
为了防止 GPT4o 蒙对,再给它加测一题:
依旧正确的判断出拿杯子的手是左手。(其它模型我也测了,它们依旧失败)
这个简单的测试,直接暴露了现在几乎所有 AI 绘图模型都左右不分。
Gemini,Grok 和豆包、可灵是完全不分左右,它们画不出来,倒也情有可原。
GPT4o 是在能分清左右的情况下,依旧无法生成“左撇子”有关的内容,这就很有意思了。
所以,它们依旧不懂物理规律。
产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%,因此绝大多数训练图像都右撇子。
而且训练 AI 的数据集中,一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。
因此,AI 会简单的认为:喝水=右手动作。
只是根据其数据集的统计概率生成图像,不是真正的理解。
所以,AI 就是稳定的无法画出“左撇子”的任何动作?
至少对 GPT4o 来说,实际情况比这个更复杂。
不信?你可以让 GPT-4o 画下面这个图:
“左撇子拿书。”
文章来自微信公众号 “夕小瑶科技说”
【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。
视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0