「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
来自主题: AI资讯
10927 点击 2024-07-17 19:46
13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
视频生成也能参考“上下文”?!
“欧洲OpenAI”和“Transformer挑战者”强强联合了!
专为大学生搞科研的大模型,来了。
AI是第三次计算革命,而中国是最佳的孵化地。
在智能手表AI化这件事上,如何平衡同样将非常重要。
你有大模型选型焦虑吗?
大模型理解、推理Excel,现在变得更加精准了。
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??
近期,关于多模态大模型的研究如火如荼,工业界对此的投入也越来越多。