OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一OpenAI刚刚发布SWE-Lancer编码基准测试,直接让AI模型挑战真实外包任务!这些任务总价值高达100万美元。有趣的是,测试结果显示,Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。
OpenAI刚刚发布SWE-Lancer编码基准测试,直接让AI模型挑战真实外包任务!这些任务总价值高达100万美元。有趣的是,测试结果显示,Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。
又一个AI硬件夭折了!爆火的Ai Pin曾获奥特曼投资,号称要革iPhone的命,如今却被曝出退货量超出销量,Humane公司以1.16亿美元被惠普收购。
Sam Altman 又当了一回谜语人。2 月 16 日,他宣布更新了我们的老朋友 GPT-4o,却没说细节。
离开OpenAI后,他们俩把ChatGPT后训练方法做成了PPT,还公开了~
OpenAI前CTO Murati离职后,终于官宣新动向!她创立的「思考机器实验室」汇聚了OpenAI、谷歌DeepMind等顶尖AI人才,包括OpenAI联合创始人Schulman、前安全副总Lilian Weng等。
今天凌晨,一个创业消息引爆了整个 AI 社区:一家名为 Thinking Machines Lab 的新创业公司建立了,而其背后有一个堪称有史以来最豪华的大模型创业团队阵容。
GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
2025年,中国大模型迎来最高光时刻。DeepSeek凭借深度推理、低成本强势崛起,中科院系AI企业祭出的YAYI-Ultra大模型在代码能力上超越GPT-4o,成功跻身OpenCompas榜单全球前十,高精度和低能耗兼而有之。
时隔两年,Sydney又回来了!奥特曼官宣了GPT-4o更新后,网友测试发现,ChatGPT不仅「戏精」附体,甚至能深入人心,让人感动落泪。
早在2024年5月,DeepSeek-V2就凭借GPT-4的百分之一的价格,被称作“价格屠夫”、“AI界的拼多多”,彼时,它带来的冲击还停留在底层模型竞争中的定价等具体动作。