这两年,全球AI竞争的逻辑正在发生变化——从技术探索期进入应用兑现期。
前两年还在比拼谁参数更猛、模型更大,如今风向已然转向:谁能把AI真正落地,谁才拥有真正的竞争力。
在这一轮比拼中,中国凭借庞大场景、真实数据密度与完整硬件生态,开始具备领跑条件。
这一幕,在今年MWC的展区现场被直接印证,与其说是国际展会,不如说更像是中国AI的一次集中登台。

在这一众身位领先的选手中,小米展现出的「AI浓度」高得有那么亿点点离谱——
此次,小米将AI赋能的「人车家全生态」首次亮相海外,从手机到汽车再到智能家居,AI贯穿生活动线,在真实环境中形成协同运转。
不仅现场体验十分吸睛,行业人士打卡、主流媒体持续关注,也让这一探索成为本届展会最具讨论度的AI样本之一。

跻身全球开源大模型第一梯队的AI能力,叠加10亿级人车家终端生态规模,让AI走出屏幕,在现实世界落地。
当全球AI竞争进入拼落地的下半场,人与现实世界的交互正在被重新定义。
在全球AI竞争格局重塑中,中国AI已经走在世界前列。
大家应该都深有感受,从2025年到2026年初,整个AI行业可以说被参数、多模态、智能体卷到「飞起」。
上个月OpenClaw一个横空出世,更是把大家对于AI的想象力狠狠往前推了一把——
很难不承认,我们认知里那个只会回答问题的AI,竟然能够自主执行并做决策了。
于是名场面也来得飞快:这边你部署你的龙虾,那边我部署我的龙虾,发Gmail邮件、接文档、配置skills各种玩法整起~
香是真香,但很难忽略的一个事实是——
AI确实能做执行,但无论怎么执行,其活动半径也很难离开单一设备和赛博环境。
让它写网页、跑脚本、做网站,没问题,但要让它走出屏幕,去干点物理世界里的实在活儿,立刻难度飙升。
这其实也是LeCun这几年一直反复强调的事情:当前AI最缺失的能力之一,就是对物理世界的理解。
AI的终极战场,不只是更聪明地生成内容,而是让AI进入真实空间:持续感知环境变化、即时做出判断,并作用于具体设备,也就是所谓的「空间智能」。
但要做到这一步并不轻松:既要硬件具备稳定的感知与执行能力,又要生态能够承接场景理解与协同调度,只有当硬件+生态真正形成成熟的闭环,AI才有机会稳稳融入真实生活场景。
难归难,但,局面也并非无解。
当有玩家同时具备顶尖AI能力与庞大生态体系时,推进路径自然会出现新的可能。
在今年的MWC展会上,小米给了一个非常直观的答案,将强大AI技术与生态能力融入「人车家全生态」。
展会现场,小米不仅展示了搭载全新HyperAI系统的智能手机、配备小爱语音助手的智能汽车等AI产品,还在海外首次亮相了由Xiaomi MiMo自研大模型驱动的「全屋智能系统」——Miloco。

Miloco在交互、感知、生态与安全层面形成协同能力,为家庭建立统一决策中枢。
使智能家居不仅具备画面理解能力、全屋视觉问答能力,同时还具备规则驱动的智能触发能力——
举个栗子,过去我们看书时开启台灯依赖手动操作或语音指令,而现在只需预设读书开灯规则,Miloco就能自动识别阅读行为,并自动触发灯光开启:
此外,基于小米强大的硬件生态,Miloco还拥有出色的多设备协同能力。
在今年的MWC现场,Miloco就当场露了一手,能根据人的状态自动调节灯光,用户正常看电视、看书、刷手机,Miloco会对应场景切换不同光源,整个过程无需人为干预,人几乎感知不到它的存在。
但说到底,智能家居真正的价值,除了开灯关灯这种小事外,还有那些你明明看见了,却懒得动的日常小麻烦。
比如——扫地,在MWC现场,Miloco识别到地面有垃圾后,还没等主人开口施令,Miloco就直接把扫地机器人叫起来扫地了。

从全域环境精准感知,到用户潜在意图深度理解,再到多设备协同高效执行。
全屋智能首次实现看见—思考—行动的全链路贯通,让智能家居更聪明、更主动、也更安全。
Miloco在MWC的海外首秀被追捧,其实已经把一个行业真相摊在台面上——
当AI开始走进物理世界帮我们实实在在干活,AI带来的变化会从「概念演示」直接变成「体感差异」,用户能在同一条动线里感受到:手机给出意图、车接住任务、家里完成执行。
这种能被切身感知、在真实场景中顺畅运转的变化,在今年MWC小米展区持续升温的现场热度中得到真实印证。
而推动AI走进物理世界的关键变量,恰恰落在小米长期积累下来的两件事上——
顶尖AI能力与10亿级人车家全生态。

△图片由AI生成
在技术层面,小米MiMo本身就拥有全球开源大模型第一梯队的极夯实力,这为AI能作用于现实环境提供了坚实的神经中枢。
从2024年入局基座大模型,到2025年陆续推出语言、多模态、语音、具身等方向模型并持续开源,小米MiMo逐步完成了从「单点能力」到「体系化能力」的搭建。
第一代MiMo重点在打基础。
MiMo-7B提升推理能力,MiMo-VL-7B让视觉理解走向实用,MiMo-Audio补齐语音能力, MiMo-Embodied打通具身场景。
当技术底座足够夯实,国际测评中的表现自然会给出相应反馈——
在数学推理(AIME 24-25)与代码竞赛(LiveCodeBench v5)中,MiMo仅以7B规模,超越OpenAI闭源推理模型o1-mini,展现出对标乃至领先全球主流模型的实力:

而到了第二阶段,MiMo直接把重心砸向效率和开源。
去年12月,Xiaomi MiMo-V2-Flash开源后,在多项权威综合评测中取得优异成绩,跻身全球开源第一梯队。
而今年2月推出的混合稀疏注意力架构HySparse,则标志着大模型在「能不能算」向「算不算得起」的关键转变中迈出重要一步。
当模型具备足够强的底层能力,AI就能走出云端,成为跨设备协同的大脑中枢,也因此有了真正可落地现实环境的技术基础。

△图片由AI生成
除了底层模型能力之外,决定AI能否进入现实物理空间的,还有——生态壁垒。
过去几年,AI行业已经进入一个新阶段,模型本身的能力正在趋近同质化,推理、多模态、智能体持续进化,但AI在「能理解」与「能行动」之间仍存在一道很深的门槛。
换句话说就是——AI要想走出屏幕,涉及的不仅仅是算力问题,还需要有具备承接能力的硬件生态。
而这正是小米这些年持续深耕的方向。
过去近十年,小米持续将AI嵌入手机、家电、可穿戴与出行终端,让设备从功能工具,逐渐成为智能能力的承载点。
当庞大的硬件规模构成生态协同的物理基础,不同终端的能力得以串联,AI也因此具备进入现实场景运行的条件,硬件生态规模随之成为关键变量——
截至2025年第三季度,小米全球手机月活跃用户超过7.4亿,IoT连接设备突破10亿规模,共计覆盖200余个产品品类,触达95%的日常生活场景,由此托起了全球最大的消费级硬件平台,并推动企业向AI驱动的人车家生态持续演进。

人车家生态能够逐步形成闭环,背后同样有一条长期投入的支撑线在持续发力:研发。
2025年,小米投入约75亿元用于AI研发,占全年总研发预算的四分之一,未来五年研发投入计划至少达到2000亿元,核心方向之一便指向模型能力与终端网络的深度融合。
与此同时,一个清晰可见的趋势正在形成,AI竞争的焦点,正从单点能力比拼转向体系能力的落地建设,而这一变化,已在小米的实际布局中逐步显现——
目前,AI能力已深度融入小米手机、汽车、新零售与智能制造等核心体系,并在终端网络中形成规模化沉淀。
围绕个人生活、家庭空间与出行场景,小米正加速成为一家AI赋能的「人车家全生态」公司,让智能体验在不同场景之间自然流动、持续衔接。
Miloco所展现出的强大的物理世界跨设备协同能力,正是小米顶尖AI能力+10亿级人车家全生态长期积累的体现。

模型负责理解与决策,硬件生态承担感知与执行,10亿级人车家生态提供场景连接,三者协同,才让智能具备在真实空间中持续运行的可能。
当技术体系与设备网络形成合力,AI形态也随之变化,从单点能力进化为系统能力。
以技术为中枢、以生态为载体,逐步从屏幕延伸至物理世界,形成可持续运行的现实路径。
过去十年,全球AI竞争几乎围绕着同一条主线展开——模型能力。
参数规模、推理深度、生成质量,这些可被量化的指标,一直被视作技术跃迁最直接的刻度,也长期占据行业叙事的中心。
一边是OpenAI、谷歌、Anthropic等海外巨头的群雄逐鹿。
OpenAI不断迭代ChatGPT模型能力,推动全模态融合与复杂任务执行能力;谷歌以Gemini构建多模态优势,并逐步强化推理与记忆能力,与自身生态深度联动。
另一边,这几年国内百模大战同样打得如火如荼,各路玩家模型能力持续推进,模型迭代密度不断上升。

△图片由AI生成
但狂热竞赛背后,模型能力已逐渐触达阶段性上限,单纯比拼单点性能的意义越来越小,边际提升的投入成本更是水涨船高。
于是,一种更深层的分野正在出现:
全球AI竞争的焦点,正从智能体「能做什么」,延伸到能否在「现实世界」真正发挥作用。
在这条路径上,中国AI展现出更早贴近真实场景的优势——
庞大的市场体量、持续生成的真实数据,以及移动互联网、智能终端的长期积累,共同构建起AI进入物理空间的现实基础,让由场景牵引技术的发展路径具备先发土壤。

这两年,中国AI走进生活的方式,越来越具体可感。
在自动驾驶领域,我国高阶智驾车辆规模已进入百万级,AI也逐步融入城市交通治理等真实的生活系统。
在传统产业升级中,我国AI这些年也开始进入能源电力、轨道交通、建材等多个行业,形成上千个实际应用场景。
今年春节,这种落地趋势更进一步延伸进日常生活——
从点奶茶到和AI打视频,大模型开始处理各类生活琐碎事务,成为贴近现实的生活助手。
今年MWC现场所呈现出的变化,正是这一方向的集中体现。
越来越多中国厂商的AI能力开始跨越设备边界,推动应用真正落地,让模型能力从参数指标转化为可感知的现实体验。

在这一过程中,小米成为一个具有代表性的样本。
多年积累下来的技术与生态能力,让AI开始作用于生活的各种小事中去,在不同终端之间实现流动,在真实使用中持续发挥作用。
当很多玩家还停留在单一场景的尝试阶段,小米已经搭起了覆盖个人、家庭和出行的终端体系。
让AI可以在不同空间之间自然衔接,在生活场景中持续运行。
当这套体系逐渐成型,AI进入物理世界就具备了规模化落地的条件,技术开始融入生活结构,成为长期存在的一部分。
而在这一时间点上,小米已经凭借生态规模与硬件能力,率先走在全球行业的前列。
文章来自于微信公众号 "量子位",作者 "量子位"
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales