千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配
千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。
上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。
EverMind 想做点不一样的。这家由盛大集团孵化的公司,定位是为所有AI Agent提供一个通用的"记忆层"(Memory Layer)。它的核心产品EverOS是一套开源的长期记忆系统,开发者可以把它接入自己的Agent,让AI不仅能记住用户的历史对话和偏好,还能像人一样对记忆进行整理、更新,甚至从过去的经验中学习和进化。
刚刚的消息,Cloudflare 联合 Stripe 发布了一份新协议,Agent 现在可以独立成为 Cloudflare 的客户。它能自己创建账户、订阅付费方案、注册域名、拿到 API token,然后直接部署代码
和AI聊天,经常会出现一些很荒唐的事儿。这次的主角是豆包。 最近,我在跟豆包聊AI Agent的时候,随口问了一句:李沐(前亚马逊首席科学家)有没有讲过Proactive Agent的视频? 豆包秒
这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一
4 月 30 日,阿里发布全新 Agent 产品 QoderWake,定位是“生产可用、安全可控、自进化的数字员工”。它不是再做一个“更聪明的 AI 助手”,而是试图回答一个更难的问题:Agent 如何从工具变成岗位。
今天,智谱发布了一篇名为《Scaling Pain:超大规模Coding Agent推理实践》的技术报告,披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。
Snapchat 近日宣布,在其核心聊天功能中推出全新广告产品 AI Sponsored Snaps。这一产品是在原有 Sponsored Snaps 广告形式基础上的全新升级,广告主可以将自有 AI Agent 接入 Snapchat 聊天界面,与用户展开实时、个性化的深度交流互动。
Andrej Karpathy(OpenAI 联合创始人、前特斯拉 AI 负责人、现 Eureka Labs 创始人)在 AI Ascent 2026 上与红杉合伙人 Stephanie Zhan 对话,谈论自他提出 "vibe coding" 一年以来的变化。他解释了为什么作为程序员他从未感到如此落后,为什么 agentic engineering 是在 vibe coding 之上
今天没选题了,所以想开源一个我自己做的,已经用了快1个多月,迭代了好多版的一个我觉得很有用的Skill。我把它称为,洁癖.Skill。名字可能听着还挺呆逼的,但是我觉得它能干的事,虽然看着非常的简单,但是却又很实用,在公司内部同事和一些我们的合作伙伴使用后,还都反馈挺不错的。