「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
搜索
13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
是中厂的机会 还是大厂的机会?
本文揭示了OpenAI一年创收34亿美元的收入构成,主要来自ChatGPT付费用户,API收入仅占15%。
机器人行业的「GPT-3」时刻已经出现?
假如你有闲置的设备,或许可以试一试。
视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发展出真正的视觉能力?
最核心的Claude 3.5编码系统提示,火遍Reddit社区。就在刚刚,原作者发布了进化后的第二版,有的网友已经将其加入工作流。
MoE已然成为AI界的主流架构,不论是开源Grok,还是闭源GPT-4,皆是其拥趸。然而,这些模型的专家,最大数量仅有32个。最近,谷歌DeepMind提出了全新的策略PEER,可将MoE扩展到百万个专家,还不会增加计算成本。
AI救了孙正义
插播一条热知识!