独家对话罗福莉:AI范式已然巨变!
独家对话罗福莉:AI范式已然巨变!作者:张小珺 2026年,大模型战争全面升级,掀开了第二幕。 在AI范式巨变之时,我访谈了人工智能研究员罗福莉。罗福莉曾供职阿里达摩院、DeepSeek,目前是小米大模型团队负责人,主导研发了MiMo
搜索
作者:张小珺 2026年,大模型战争全面升级,掀开了第二幕。 在AI范式巨变之时,我访谈了人工智能研究员罗福莉。罗福莉曾供职阿里达摩院、DeepSeek,目前是小米大模型团队负责人,主导研发了MiMo
近日,AI创业公司Naive.ai的融资消息引发广泛关注。据多家媒体报道,这家由清华大学电子工程系副教授代季峰创立的新公司,已完成约3亿美元融资,估值约8亿美元。投资方包括一线基金和科技巨头,具体机构暂未披露。公司专注于开源模型的后训练和AI Agent方向,核心团队包括前MiroMind成员及联合创始人朱锡洲。
最近,Lenny Rachitsky 请到了 Kat Wu,Anthropic Claude Code 和 Cowork 的产品负责人,访谈了一期播客。节目信息密度相当高,从 PM 角色的变化、Anthropic 的内部流程,到源码泄露事件和 OpenClaw 决策,全都聊了个遍。
写在前面: 太疯狂了,这大概是 APPSO 报道 AI 以来经历过更新最为密集的一个月。 在给大家介绍完一众新模型后,今天这篇文章,想和你聊聊对AI 行业的发布周期所产生的「超现实」现象。 在车轮滚滚
从单幅图像恢复三维结构,到多视图场景建模、动态 4D 重建,再到机器人、自动驾驶、SLAM 与视频生成,如何让模型在不依赖逐场景优化的前提下,直接、高效地理解并重建三维世界,正在成为 3D 视觉领域的
最新消息是,DeepSeek V4 Pro 2.5折的大力度优惠来啦!官方API文档显示,DeepSeek-V4-Pro模型API限时2.5折优惠,优惠期截至2026年5月5日。 具体是这样: 1️⃣百万tokens输入(缓存命中)折后0.25元(原价1元); 2️⃣百万tokens输入(缓存未命中)折后3元(原价12元); 3️⃣百万tokens输出折后6元(原价24元)。
弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。
今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。
Cognichip正在构建一个深度学习模型,以便在工程师设计新计算机芯片的过程中为其提供协助。它试图解决的问题是该行业数十年来一直面临的一个难题:芯片设计极其复杂、成本高昂且速度缓慢。先进的芯片从概念设计到大规模生产需要三到五年的时间;仅设计阶段就可能长达两年。想想看,英伟达最新的 GPU 系列Blackwell就包含1040 亿个晶体管——要排列这么多晶体管可不是一件容易的事。