
罗福莉首次演讲有点“小紧张”,但金句很爆。
罗福莉加入小米后的首次公开演讲,来了!
智东西12月17日北京现场报道,刚刚,小米举办了年度“人车家全生态”合作伙伴大会,现场人头攒动座无虚席,展区不少展台都已被围观人群挤满,讨论热度颇高。

小米创始人兼CEO雷军此次并未来到现场,小米集团合伙人、集团总裁卢伟冰率先登台演讲,今天第三位演讲的是当前备受关注的原DeepSeek核心成员、被业内称为“天才少女”的罗福莉,她现在的职位是小米MiMo大模型负责人。

罗福莉在演讲过程中虽然稍显紧张,但她抛出的海量金句却句句令人印象深刻:
·AI正以非线性的方式重演人类大脑6亿年的进化史;
·语言是人类思维和物理世界在符号空间的“投影”;
·下一代智能体系统不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”;
·相比生物演化的稳固根基,AI的发展是“空中楼阁”;
·AI进化的下个起点,一定是有一个能跟物理世界交互的模型;
·算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力;
·开源的价值本质上是一种分布式的技术加速主义;
·开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径;
在演讲中,罗福莉首次明确解读了小米打造Agent语言基座模型的三个核心方向,解读了新模型背后的多项关键技术突破。对小米如何通向AGI,罗福莉也明确了小米的路径。

除了AI大礼包,今天会上,卢伟冰也分享了小米整体业务的诸多亮点。

卢伟冰说,2025年是小米“大发展”的一年,今年前三季度,小米收入同比增长32.5%,超过了3400亿元,经调整利润同比增长73.5%,其中手机销量中国市场1-10月排名第二。
未来五年,小米集团研发投入预计将超过2000亿元,2026年预计研发投入在400亿左右。

小米人车家生态究竟包括什么?卢伟冰这次给出详细拆解:
产品包括个人设备、出行设备、家庭设备;
核心技术包括芯片、OS、AI;
智能制造包括手机、汽车、大家电工厂;
什么是小米当前聚焦的核心,一目了然。

在大家最关心的AI方面,小米自研MiMo系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

一个月前的11月12日,罗福莉在朋友圈正式官宣加入小米Xiaomi MiMo团队。就在昨晚,小米刚刚发布了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,这也是罗福莉加入后MiMo团队亮出的首个新成果。
罗福莉一上台就回到了“6亿年前”,她说,AI正以非线性的方式重演人类大脑6亿年的进化史。

为什么大模型“智能”起源于语言?在罗福莉看来,语言是人类思维和物理世界在符号空间的“投影”,而大模型成功解码了人类思维在文本空间的投影。

小米从“语言”出发,构建了面向Agent时代的语言基座模型MiMo-V2-Flash。
在小米看来,超强的代码和工具调用能力是Agent沟通的高效“语言”,围绕极致推理效率设计的模型结构是“高带宽”的Agent协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。

这三个方面是小米聚焦的重点。
罗福莉特别提到,MiMo-V2-Flash模型并不大,但在代码和Agent测评基准测试中已经达到全球开源模型TOP2。

MiMo-V2-Flash的推理效率是其突出优势,在全球大致相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本和高速度优势。

具体来看,小米围绕极致推理效率来设计模型结构,采用了Hybrid SWA架构,固定KV Cache,增强长文推理,此外,团队采用3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升。

在全新后训练范式方面,团队采用了Dense&Token-Level的强化学习。

当前MiMo-V2-Flash已经初步具备了模拟世界的能力,比如通过HTML写操作系统、模拟太阳系、画一颗圣诞树。

今天发布会现场,罗福莉宣布MiMo-V2-Flash发布即开源,模型权重、技术报告都开源,API限时免费。
对于未来的Agent发展,罗福莉提到,下一代智能体系统,不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”。

Agent执行从“回答问题”到“完成任务”,具有记忆、推理、自主规划、决策、执行的能力。
Omni感知统一多模态感知,为AI理解物理世界打下基础,嵌入眼镜等智能终端、融入日常工作流。
在通往AGI的路上,罗福莉团队希望补全缺失的演化拼图,单纯Scaling UP参数量不够,他们要让LLM回到“演化课堂”,补上它跳过的关键学习步骤。
简单来说,他们非常看重AI与真实世界的交互,强调多模态。
罗福莉特别提到,相比生物演化的稳固根基,AI的发展有些像“空中楼阁”。在她看来,AI进化的下个起点,一定是有一个能跟物理世界交互的模型。
AI不仅要看懂画面,还要理解背后的物理规律;AI不仅要推理文本,而是理解世界的运作逻辑。
罗福莉说,这一观点并非共识,行业中也有不少人认为语言就可以实现最终的AGI,比如Ilya。
在她看来,算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力。
罗福莉现场也开启了“招聘会”,她提到,小米大模型Core团队是研究、产品与工程深度耦合的年轻团队,“小而美”却充满创业精神,他们极度好奇、追求真理。

罗福莉提到,在她刚刚开始研究时,开源模型与顶尖模型的代差有三年,而今天这一差距已经缩短到了“数月”。
他们相信开源的价值,开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来,开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径。
未来,从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球AI共同定义未来。
95后罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作,2022年入职DeepSeek,参与了MoE大模型DeepSeek-V2的研发。
集诸多光环于一身,来到小米的罗福莉,其动向一直是业内关注的焦点。
AI,显然是整场小米生态大会围绕的核心关键词。
面向AI未来,小米的机会点显然不止于AI手机,手机、PC、穿戴、IoT、汽车,小米人车家全生态均能与AI深度融合,小米在大模型方面的AI基础能力提升则进一步加速了这一进程。
卢伟冰近日曾提到,小米AI大模型业务过去投入持续增长,“AI与现实世界深度融合”已被列为小米未来十年核心战略。显然,面对AI这场硬仗,小米已经做好准备All in,“兵马和粮草”都在加码筹备。
文章来自于“智东西”,作者 “云鹏”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md