LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。
随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。
一觉醒来,OpenAI 的大模型又完成了一项壮举!在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一!
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。
想知道全球各大企业对大模型是如何使用的大模型的,今年和去年有哪些不同,请看Artificial Analysis发布的2025年第一季度AI应用报告,把握AI发展的潮流趋势。
AI吞噬资源、操控表达、重构秩序。每次AI进步都暗埋代价,硅谷精英却信仰末日选择不育。七年调查,华人女记者出版了《AI帝国》,揭露OpenAI背后的隐秘真相!
刚刚,全球最强开源医疗模型发布,来自中国。百川开源最新医疗推理大模型Baichuan-M2-32B,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。
这就是我与 HMD 3210 的奇遇记:一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。
7 月 27 日,腾讯发布了具身智能开放平台 Tairos,以模块化的方式向行业提供大模型、开发工具和数据服务,试图为具身智能的研发和应用提供一套通用的支撑体系。
我们都爱AI带来的「认知捷径」,但CEO Greg Shove却分享了他认知滑坡的亲身经历。真正的分水岭不是用或不用AI,而是你选择成为驾驭AI的「驾驶员」,还是被其淘汰的「乘客」。
不会使用AI的工程师就会落后。一位工程师小哥科尔顿·沃奇,说看到这类观点引发了自己巨大的精神焦虑。幸好他是一个持怀疑态度的人,测试完一堆AI开发工具后,发现也就那么回事。