Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境
Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。
在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。
由Anysphere 的 Cursor 和 Anthropic 的 Claude Code 等 AI 编程工具共同创造的收入已突破 31 亿美元。据直接了解 Cognition 财务状况的人士透露,这其中包括 Cognition 的 Devin 编程代理产生的近 4 亿美元年化收入——这一数字此前未被报道过。
AI闹推出了新栏目 AI 实践派(AI Practitioners)
当所有人都以为AI发展的剧本是「英伟达卖铲子,OpenAI挖金矿」时,谷歌用Gemini 3告诉世界:如果我自己造了一台全自动挖掘机,还需要买谁的铲子,谁能挖得过我?
对于硬件,对于AR,应该都不甚了解的某知名投资人朱啸虎,对自己出手的第一个AI硬件也是AI眼镜项目是如此评价:“Gyges Labs的DigiWindow技术相比其他等方案,有着一个非常重要的优势:它的显示模组隐形,能把内容投到眼睛,
近日,无问芯穹完成近 5 亿元 A+ 轮融资,本轮融资由珠海科技集团、孚腾资本(元创未来基金)领投,惠远资本、尚颀资本和弘晖基金跟投,老股东洪泰基金、达晨财智、尚势资本&海棠基金、联想创投、君联资本、申万宏源、徐汇科创投、元智未来持续追投。此次融资阵容汇聚国家产业资本与头部市场化基金,“国资+市场”的双重认可,既肯定了公司面向国家重大战略需求的技术创新,也充分鼓励着无问芯穹,
智能体终于拥有了可以海量复制的“实战演练场”。阿里此次开源的新项目ROCK,解决了无法在真实环境中规模化训练的难题。有了ROCK,开发者想要训练AI执行复杂任务时可以不再“手搓”环境,直接进行标准化的一键部署。
近日,总部位于东京的初创企业 NGA 宣布,旗下亚洲领先的人工智能招聘平台 HelloBoss 完成 A 轮融资,由 BAI Capital 领投。这笔交易也是贝塔斯曼集团通过 BAI Capital 在日本市场完成的首笔创新风险投资。
乖乖,反正我是被“震”到了。
AMiner 团队依托十余年学术数据挖掘经验,推出的“AMiner 亮点”功能,以其底层创新的作者消歧技术和全方位的学术服务能力,为学者提供了高效解决方案。 本文将从技术原理与产品实践双维度,深度解析“AMiner 亮点”在传统学术成果整理上的突破。
马斯克主动为Grok 5戴上「纯视觉感知」与「拟人延迟」的双重镣铐,彻底告别API读数据与暴力手速的作弊时代,向传奇战队T1发起挑战。这是一场终极图灵测试,AI不再靠微操碾压,而是像人类一样通过「看」屏幕理解像素、依靠阅读战术与其后的逻辑推理来博弈。
前些天,一项「AI 传心术」的研究在技术圈炸开了锅:机器不用说话,直接抛过去一堆 Cache 就能交流。让人们直观感受到了「去语言化」的高效,也让机器之心那条相关推文狂揽 85 万浏览量。参阅报道《用「传心术」替代「对话」,清华大学联合无问芯穹、港中文等机构提出 Cache-to-Cache 模型通信新范式》。
腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。
既然语言可以当序列来学,那图像能不能也当序列来学?
2023 年,三星公司在接入 ChatGPT 不久之后,接连发生数起内部机密泄露事件。事件起因是三星员工将半导体设备参数、产品源代码和生产良率等商业机密直接输入对话系统,导致敏感信息被录入 ChatGPT 的训练数据库。
Xsignal AI Holo(AI 全息)数据库显示,中国移动互联网的AI落地已彻底分化为两条路径:以微信、抖音的AI搜索为代表的“AI Overview (AIO)”旨在筑起认知的长城,将决策锁定在生态内部;而以QQ浏览器QBot为代表的“Agent in App (AIA)”则正演变为主动式的“数字员工”,重构服务分发的主权。
视觉-语言-动作模型(VLA)在机器人操控领域展现出巨大潜力。通过赋予预训练视觉-语言模型(VLM)动作生成能力,机器人能够理解自然语言指令并在多样化场景中展现出强大的泛化能力。然而,这类模型在应对长时序或精细操作任务时,仍然存在性能下降的现象。
脉冲神经网络(SNN)不用再纠结二进制短板了。
OpenAI于2025年11月22号震撼发布GPT-5早期实验报告,揭示了AI从「聊天机器人」向拥有逻辑直觉的「硅基科研员」进化的里程碑式飞跃。从协助破解困扰数学界数十年的Erdős谜题,到将数月的生物实验推理压缩至几分钟,GPT-5展现了惊人的跨学科洞察力与推理质变。这份报告宣告了AI4S时代的降临:AI是科学家手中那架穿透未知迷雾的「认知望远镜」。
科学发现的轨迹,如同交织在人类历史中的璀璨织锦,经历了一系列范式的演进。早期的探索,主要依赖于由直觉、反复试验或机缘巧合驱动的经验发现。随后,以牛顿力学为代表的理论框架,为我们洞察自然现象的基本原理提供了基石。
互联网上,越来越多的句子有一股「AI味」。风景永远惊艳,事件永远关键,语言被磨成光滑的模板。于是,Wikipedia在成千上万次巡查里最先察觉,并悄悄发起一场清理行动。
今天读了 Aha(原 Head AI)的两篇博客文章,我强烈建议所有做 AI 工具或者 AI ToB 产品的同学都读一读。https://aha.inc/university?universityType=Aha+insights&utm_source=inf001这里有他们对 AI 产品边界的理解,也有很多工程和系统层面的实操细节。
今天凌晨,“硅谷钢铁侠”马斯克宣战了!他在 X 帖子中提出了一项引来1500多万网友围观的挑战:让Grok 5在2026年以人类视觉和反应速度限制下,对战《英雄联盟》顶级人类战队。
外媒最新消息显示,月之暗面的新一轮融资,已经进入临门一脚的“收尾阶段”。这一轮资金规模被多名知情人士形容为“数亿美元级别”,目标估值则被抬到了约 40 亿美元区间。相比 2024 年 B 轮融资时 30 亿美元出头的定价,又上了一个台阶。
聚焦新加坡 如今,中新两国都在大力加码AI。新加坡总理多次强调AI是国家战略重点,也在积极吸引全球人才;中国AI企业和技术也在快速“出海”,更有中国AI煎饼机器人入驻新加坡引爆潮流~ 而最近,AI圈更
2小时17分钟,这是截至2025年8月,前沿AI模型在保持50%成功率的前提下,能够维持连续推理工作的时长。这个数字意味着AI已经从处理“秒级”的代码片段,跨越到了处理“小时级”的复杂工程任务。
Google宣判RAG死刑!那条曾让无数工程师自豪的技术链,如今只剩下一行API调用。Gemini的File Search,把检索、分块、索引、引用,全都封进了模型内部。开发者不再需要理解流程,只需要上传文件。当智能被自动化吞并,工程师第一次发现,自己也成了被自动化的一部分。
5 天过去了,Nano Banana Pro 的热度依旧在屠榜,而人类终于发现了它可能最恐怖的能力:时空重现。
AI正从「规模时代」,重新走向「科研时代」。这是Ilya大神在最新采访中发表的观点。这一次,Ilya一顿输出近2万字,信息量爆炸,几乎把当下最热门的AI话题都聊了个遍:Ilya认为,目前主流的「预训练 + Scaling」路线已经明显遇到瓶颈。与其盲目上大规模,不如把注意力放回到「研究范式本身」的重构上。
美国加州大学圣地亚哥分校(UCSD)徐升教授对 DeepTech 表示:“很荣幸我们的工作成为 Nature Sensors 期刊的首篇论文,我们第一次通过 AI 的方法实现了在动态下抗运动伪影的人机交互,应用场景包括可穿戴和移动设备的手势控制、机器人遥操作、AR/VR 动作追踪、游戏、康复与辅助设备、工业与军事训练、健康与运动监测、