全世界程序员,都在偷偷给Claude搓硬件
全世界程序员,都在偷偷给Claude搓硬件因为 Claude 太好用,硬件的更新似乎都跟不上它的进化速度了,于是程序员们硬是把一个写代码的 AI 工具,玩成了一个「超级 IP」。由于网友太过热情,负责开发 Claude Cowork 的 Felix Rieseberg ,直接在Github 上线了一个支持外设硬件接入的项目:
搜索
因为 Claude 太好用,硬件的更新似乎都跟不上它的进化速度了,于是程序员们硬是把一个写代码的 AI 工具,玩成了一个「超级 IP」。由于网友太过热情,负责开发 Claude Cowork 的 Felix Rieseberg ,直接在Github 上线了一个支持外设硬件接入的项目:
伯克利团队归纳出7种反复出现的模式:智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。
人才奇点先于AGI到来!Meta狂挖Mira Murati120亿估值公司,第5人正式就位。巨头不再买公司,而是直接买大脑——这场抢人大战,让所有AI创业者后背发凉。
4 月初,LM Arena 评测平台上出现了三个匿名图像模型,代号分别是 maskingtape-alpha、packingtape-alpha、gaffertape-alpha。几小时后它们消失了。OpenAI 官方还没有正式宣布这个模型,但根据 API 返回的元数据和用户侧的测试记录,它已经有了一个被广泛接受的名字:GPT Image 2。
极限开发赛制(如黑客松、Game Jam)能让大家在几十小时内燃烧激情,但正如全球最大的 Game Jam 活动组织 Global Game Jam 的执行总监所言,48 小时内诞生的作品往往只是一个起点,缺乏长期的沉淀,很难直接变成成熟的作品。
今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。
AI 的整体表现已经胜过了人类。或者按 AAAI 官方的说法是:「对 AAAI-26 作者和程序委员会成员的大规模调查显示,参与者不仅认为 AI 评审有用,而且在技术准确性和研究建议等关键维度上,实际上更偏好 AI 评审。」
古茗在测试使用OpenClaw的过程中发现,技术团队只需要跟龙虾提问“当前的QPS是多少”、“订单状态是多少”等问题,它就能串联整个流程并输出结果,员工不再需要登录多个平台查看,显著提效。
刚刚AI编程工具Cursor正在洽谈新一轮融资,金额超过20亿美元,估值直接飙到500亿美元,折合人民币3409亿。黄仁勋都坐不住了。英伟达CEO公开表态要参投这轮融资,还说Cursor是他"最喜爱的企业AI服务"
浪费的原因很具体,AI应用从“对话”转向“执行”,这些计算资源流向了较贵的大型旗舰模型,Agent在复杂多轮任务中,历史文件、对话会不断累积,大量无用、冗余、过期的信息会不断产生并且重复计算,Token消耗因此指数级增长。也就是说,企业和开发者在用最贵的车跑最短的路。