智能家居不够“智能”,怎么办?小米集团给出了智能家居未来探索方案Xiaomi Miloco。
该方案基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则。

随着人工智能技术的飞速发展,AI大模型在理解人类语言方面取得了显著进展,能够越来越贴合人们日常的交互需求。与AI大模型的优秀表现相比,当下智能家居行业体验却显得不那么“智能”。
目前,多数智能家居系统依赖预设规则引擎,用户必须手动配置诸如“温度>30℃开空调”等等诸多触发条件,使得整个智能家居交互过程显得既机械又繁琐。
如果能把大模型的能力接入进来,则会简单且智能很多。比如你直接说 “当我读书时,帮我打开台灯,播放舒缓的音乐”,系统在识别到读书动作时就会自动完成操作。
小米认为,AI代表未来方向,「大模型+智能家居」是行业大势所趋。
Miloco的出现,重构了家庭智能范式。
同时,Miloco还高度重视隐私安全问题,端侧部署大模型保障用户隐私不被侵犯。
目前,Miloco已面向全社会开放,并在GitHub上线(链接见文末),开发者可部署、体验,参与技术共建。
传统智能家居的体验瓶颈,本质源于“规则预设固化”与“生态协同不足”的双重制约。
用户需手动配置繁琐的自动化规则,且不同品牌设备间缺乏统一联动标准,最终不得不花费大量精力“适配系统”。
而Miloco的核心研发目标,是为家庭赋予一个能理解生活细节的“AI大脑”——
它可以保存你的“雨天关窗”“睡前调温”等场景偏好,能读懂“想睡个好觉”背后对温度、光线、噪音的综合需求,更能实现跨生态设备协作,在持续交互中优化体验,真正做到越用越贴心。
这种“懂生活”的能力,植根于Miloco对大模型技术的场景化落地。
作为智能家居未来探索方案,Miloco将自研大模型能力部署到家庭边缘设备。
结合米家摄像机的实时视觉信息,通过标准化的MCP协议封装,Miloco实现了米家生态与Home Assistant(全球最大开源智能家居社区)生态的无缝打通。
同时,Miloco也支持第三方IoT平台接入,让“用自然语言定义全屋智能”从概念走向实用。
Miloco的全屋智能差异化体验,依托于Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型与四层完整架构的坚实支撑。
它从交互、感知、生态、安全四个维度优化全屋智能的交互逻辑与扩展能力,构建更贴合用户需求的智能家居解决方案。
作为Miloco智能体验的技术核心,Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型为全屋智能赋予了“感知+理解”的核心能力,是实现场景化智能联动的关键所在。
Xiaomi MiMo-VL-Miloco端侧视觉语言模型,基于小米自研MiMo-VL-7B大模型优化构建,凭借强大的视觉-语言融合能力,赋予家庭摄像头“理解画面”的感知力。
它可以轻松实现全屋视觉问答,比如查询“看看画面里有什么”“看看我的猫在哪”;
还支持规则智能触发,比如当有人读书时打开台灯,或者当有人玩手机时发米家通知提醒;

更复杂的联动控制也不在话下,比如看看小孩有没有在玩手机?在玩手机的话音箱播放“该写作业了”;或者根据画面中人的心情状态去设置灯光颜色。
同时,该模型还能完成场景化动态推理,例如检测到当画面里面有人时,根据画面中人的穿衣风格来生成赞美文案,然后用智能音箱播报生成的赞美文案;或者当画面里有人在睡觉,根据画面中人是否盖被子来调整空调的温度。

这一技术突破推动智能家居从“单一条件触发”的初级阶段,正式迈入“多维度场景感知”的高阶形态。
而这一核心能力的落地与延伸,均依赖于Miloco的四层完整架构体系。
从用户交互到硬件支撑,Miloco构建了全链路技术体系并实现全部开放——
开发者可修改和扩展体系中任何一层的能力,确保功能稳定落地与未来灵活扩展,更为“开放共创”预留出足以承载无限创意的充足空间。

Miloco的开放性打破了生态壁垒,开发者可借助其大模型能力,联动 Home Assistant以及第三方平台的设备,探索更具想象力的全屋智能场景。
同时,项目坚持“隐私安全优先”原则,所有视觉数据可在家庭端侧完成计算,不向外部服务器传输,从技术层面保障“家庭隐私不外流”,打消用户数据安全顾虑,真正实现“开放与安全兼顾”。
Miloco的发布,是小米将大模型技术落地家庭场景的重要实践,更是对智能家居体验升级的一次探索。
通过端侧大模型与全链路开放的结合,为行业提供了一种新的技术思路——让智能家居告别传统“硬编码规则”的局限,转向“对话式交互+视觉感知”的人机交互新形态。
这种新形态的核心,是从“人适应设备”到“设备适应人”的转变:用户无需学习复杂操作,可通过自然语言轻松设置自动化。
这种形态之下,设备不再是孤立的控制单元,而是能主动理解场景、协同工作的“生活辅助伙伴”。
未来,小米将持续迭代Miloco的技术能力,与全球开发者共同推动全屋智能行业向着更开放、更智能、更贴合用户需求的方向发展。
开源链接:https://github.com/XiaoMi/xiaomi-miloco
文章来自于微信公众号 “量子位”,作者 “量子位”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md