唯一登台的中国大模型创始人,杨植麟美国GTC首秀,公开Kimi技术路线图
唯一登台的中国大模型创始人,杨植麟美国GTC首秀,公开Kimi技术路线图今日凌晨,在英伟达GTC大会上,月之暗面创始人杨植麟作为本届唯一受邀现场演讲的中国独立大模型公司创始人,发表题为《How We Scaled Kimi K2.5》的演讲,首次完整披露Kimi K2.5背后的技术路线图。
今日凌晨,在英伟达GTC大会上,月之暗面创始人杨植麟作为本届唯一受邀现场演讲的中国独立大模型公司创始人,发表题为《How We Scaled Kimi K2.5》的演讲,首次完整披露Kimi K2.5背后的技术路线图。
投资界获悉,月之暗面Kimi正以投前估值180亿美元(约合人民币1200亿),进行新一轮10亿美元融资。大约一个月前,Kimi刚刚完成逾7亿美元融资,彼时估值100亿美元;而在去年底一轮5亿美元融资中,其估值还只是43亿美元。
就在刚刚,Moonshot AI(月之暗面)发布了一项足以撼动 Transformer 底层的研究:《Attention Residuals》。海外科技大 V,谷歌高级AI产品经理 Shubham Saboo 直接开启了“高赞”模式:“他们触碰了那个十年没人敢碰的部分。”
如果你在过去一年关注过大模型训练的技术,大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器,被视为是可能挑战 Adam 的新秀。它的思路很直接:对动量矩阵进行正交化,让各个奇异方向上的更新速率一致,提升训练效率。
独家获悉,月之暗面(以下简称“月暗”)已对内部组织架构进行调整。曾经以 C 端产品 Kimi 为主的团队中,负责 API 服务对接的员工一度只有个位数,而如今,随着调用需求激增,该 API 团队正在快速扩编,并以独立业务分支的形式存在,直接向总裁张予彤汇报。
今天,美国大模型独角兽Anthropic连续发布多则推文、博客,指控DeepSeek、月之暗面和MiniMax三家中国AI实验室,正对Claude进行“工业级规模的蒸馏攻击”。
此前彭博社等媒体报道称,近期月之暗面即将完成的超7亿美元融资,由阿里、腾讯、五源资本、九安医疗等老股东领投,并且已经超募。与此同时,月之暗面已经以100亿-120亿美金的估值,无缝开启了新一轮融资。
谁是老黄2026年的新座上宾?
《智能涌现》获悉,近期Kimi在和投资人的沟通中表示,公司的海外收入已超过国内收入,新模型K2.5发布后,全球付费用户已有4倍增长。这一变化恰好发生在新一代模型K2.5发布后的短短几天内。
今天凌晨,月之暗面核心团队在社交媒体平台Reddit上举行了一场有问必答(AMA)活动。三位联合创始人杨植麟(CEO)、周昕宇(算法团队负责人)和吴育昕与全球网友从0点聊到3点,把许多关键问题都给聊透了,比如Kimi K2.5是否蒸馏自Claude、Kimi K3将带来的提升与改变,以及如何在快速迭代与长期基础研究之间取得平衡。