
o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%
o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%让大模型集体吃瘪,数学题正确率通通不到2%!
让大模型集体吃瘪,数学题正确率通通不到2%!
当地时间11月7日,Anthropic与Palantir Technologies Inc.和亚马逊网络服务(AWS)合作,将Claude 3和3.5系列AI模型引入AWS,服务于美国情报和国防机构。
智东西11月8日消息,据外媒The Information报道,亚马逊正讨论向美国AI大模型独角兽Anthropic进行第二笔数十亿美元的投资。
纳尼?AI Agent容易受到弹幕影响! 甚至比人类更容易。
前些天,Anthropic 为 Claude 带来一个极具变革意义的功能:Computer Use,也就是控制用户的计算机。
刚刚,Claude 3.5 Haiku允许通过API访问,同一天,xAI也官宣Grok API也正式开启公测。
一群大模型玩你画我猜,人类一旁围观超起劲儿。 就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。
Claude ,由 Anthropic 制作的 AI 聊天机器人,现在有了桌面应用程序。您可以从Anthropic 的网站免费下载 Mac 和 Windows 版本的应用程序。
上周Anthropic发布了Claude 3.5 Sonnet的升级,让AI助手能够通过"电脑使用"功能直接与计算机交互。
前段时间Claude3.5不是更新了嘛,据说各个性能都上升了不少,其中我发现文本撰写能力更是直接上升了20%多。