Hermes上线MoA功能!比Opus 4.8和GPT-5.5还猛
Hermes上线MoA功能!比Opus 4.8和GPT-5.5还猛近日,Hermes Agent上线了MoA(Mixture of Agents)功能,支持用户自由组合多种模型作为虚拟模型使用,在Nous Research即将发布的基准测试中,这个混合模型的评分超过了Opus 4.8 和GPT-5.5。
搜索
近日,Hermes Agent上线了MoA(Mixture of Agents)功能,支持用户自由组合多种模型作为虚拟模型使用,在Nous Research即将发布的基准测试中,这个混合模型的评分超过了Opus 4.8 和GPT-5.5。
如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?
AI彻底挣脱工位束缚!刚刚,OpenClaw和Cursor同日发布原生App,把满血Agent实打实塞进了iPhone。随时随地调遣AI军团的「掌心时代」,真的来了。AI Agent,正式装入手机了!
这一次,联网的不再是电脑,而是一群会干活的Agent。
太疯狂了!一个连官网都没有的神秘中国AI「扫地僧」,以73.1%的胜率杀入CyberGym全球前七,紧咬OpenAI。全网都在疯传,这到底是谁家的高手?它叫MopMonk(扫地僧)。凭借73.1%的成功率,以微弱差距紧咬OpenAI,一举刷新了中国团队在该榜单上的历史最高分。
打脸了,家人们!!
我们公司的一个小伙伴,前阵子应聘了一份给机器人打工的工作。
AI 圈最近又热了一个词:Loop Engineering。
也是神奇,价格屠夫DeepSeek,破天荒要涨价了!
都说AI会写代码了,程序员的饭碗就保不住。但Anthropic的Boris Cherny却说:真正重要的从来不是岗位,而是你这一刻在扮演哪种角色。
最近,清华教授、智谱灵魂人物唐杰聊得有点high。
你有没有想过,以后人们做购买决定的地方,可能不再是搜索框,而是一个对话框?
新时代的 Physical AI 公司,不是本体公司,也不是模型公司。
AI盯上猫狗饭碗。
最近网上冲浪,刷到两个特别有意思的 GitHub 项目,分享给大家。
全球金融科技赛道再迎重磅融资。Z Potentials获悉,全球金融科技平台Airwallex 空中云汇近日宣布完成H轮3.2亿美元融资 ,投后估值达110亿美元。
AI能提效不假,但账单却越来越看不懂了。
长期以来,机制可解释性(mechanistic interpretability)领域有一个几乎从未被明说、却被视为理所当然的前提:模型对于同一种任务的能力或表现,背后对应着一条唯一的、或近乎唯一的内部「电路」(circuit)。该领域的研究者们之所以要做「电路发现」(circuit discovery),是为了要把这些「特定的」电路找出来。
苹果涨价,你可能骂错人了。
AI圈彻底进入生死时速!OpenAI和Anthropic极限狂飙,平均51天空降一个新模型,直接把谷歌甩在了身后。
近期,DeepSeek发布DSpark让大模型推理效率再次成为行业焦点。
0 美元你能得到什么——Gemini 2.5 Flash 和 Pro 均可用,每分钟 1M tokens,原生支持文本、图像、音频、视频多模态输入 ,几秒钟生成 API Key,即开即用
据外媒 The Information 报道:Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心涉及模型蒸馏。 Meta 担心这些外部模型生成的内容,可能进入自家的训练数据或评测体系,从而引发所谓的模型蒸馏争议。
当整个 AI 圈都在翘首以盼 Sam Altman 和前苹果首席设计官 Jony Ive 能联手掏出一部 AI 时代的 iPhone 时,OpenAI 今天却猝不及防地公布了一个键盘。
当前,物理 AI 正面临着关于泛化能力的普遍质疑。当模型缺乏对真实物理规律的深度认知、难以跨越复杂多变的开放场景时,如何让机器人真正理解物理世界并精准规划决策,已成为具身智能破局的关键。
AI当「老板」,快给10家公司干破产了……
小布米OTA V3.0来了。喊一声就跳舞,拖拽胳膊就学会新动作,还能跟你打拳——你的第一个个人机器人,这次真的听话了。
今年初,ChatGPT 开始小范围测试卖广告。半年过去,我们很好奇:那些真正把预算投进去的人,看到了什么?
Agent 正在逐渐获得「人权」。
记者获悉,DeepSeek宣布价格调整,引入峰谷计费机制:以DeepSeek-v4-pro为例,其输入价格(缓存命中)平时为0.025元/百万tokens,高峰时期为0.05元/百万tokens;输入价格(缓存未命中)平时为3元/百万tokens,高峰时期为6元/百万tokens;输出价格平时为6元/百万tokens,高峰时期为12元/百万tokens。