具身智能的Scaling Law正蓄势待发。
最近,有史以来最大的人类为中心(huamn-centric)数据集Egocentric-10K开源了——
10亿帧画面,来自2153个人类工人在真实工厂中共计10000小时的工作。

其规模是同类数据集EPIC-KITCHENS的100倍,并且将数据场景从家庭扩展至真正的工厂车间,是首个完全在真实工厂中收集的数据集。

发布不到三天,Egocentric-10K在Hugging Face的下载量就突破了1.3w次,并登顶趋势榜。

网友纷纷点赞,直呼太强了!

而这,竟出自一名18岁的连续创业者之手。
Egocentric-10K是华人小哥Eddy Xu的初创公司Build AI最新发布的具身智能数据集,Build AI官方称其为最大的开源的“物理作业”数据集(largest open source dataset of physical jobs)。

如开头所说,这是第一个完全从真实工厂中收集的huamn- centric数据集,包含10亿帧画面,来自2153个工人共计一万小时的工作,总视频片段达到了19.2万个,数据集大小达到了16.4TB。

相比Ego4D、EPIC-KITCHENS等以往的huamn-centric数据集,Egocentric-10K不仅在数量规模上更大,而且在数据收集场景中,也由日常家庭、厨房场景扩展至了真实工厂的操作。
这使Egocentric-10K在手部可见性和主动操作密度方面达到了领先水平。

在数据收集上,Egocentric-10K的操作视频数据来自全球各地的真实工厂,由工人佩戴头戴式摄像设备在抓取、组装等操作中自然录制。

其中,头戴式摄像头能够收集128°×67°、1080p、30fps的视频数据,相比许多旧数据集(720p、60~90° FOV)提升明显。
不过,Egocentric-10K数据集中目前仅有RGB视频信息,暂时缺乏深度、音频、触觉等多模态信息。
当有网友表示能否加入更多模态的数据信息时,创始人小哥卖了个关子,表示:
该让你知道的时候会让你知道的。

当然,也并不是那么密不透风。
据Build AI官网的最新介绍,其将在位于深圳的制造工厂计划于2026年生产数百万副记录眼镜,以实现全球覆盖,届时也许会覆盖更多的模态信息。

此外,也有网友对大规模数据的实际可用性提出质疑,例如工厂场景下的数据是否具备足够多样性、人类的实操经验又该如何有效迁移至机器人系统等核心问题。

而这,就引出了human-centric与真机、遥操等技术路线的差异。
与前段时间Generalist AI发布的史上最大真机数据集不同,此次Egocentric-10K主打human-centric方向,对标Figure的Project Go-Big项目,核心在于强调人类数据向机器人的迁移价值。
在这一赛道上,特斯拉与国内的它石智航等玩家也均以human-centric为核心布局,试图通过大规模第一视角的人类操作数据,让机器人学习到更灵巧、更符合直觉的manipulation技能。
相比真机,human-centric的显著优势在于:真机数据昂贵而稀缺,而人类数据在现阶段可以以更低成本、更高速度扩展规模。
但代价也同样清晰:必须跨越human-to-robot dynamics gap——人手与机械臂之间在关节、动力学、传感模式上的系统性差异。
最终,哪条路线更能抵达通用机器人智能的“临界点”,仍需要时间与数据规模去验证。
说到Egocentric-10K,就不得不提到它背后的男孩——Eddy Xu。

这位小哥今年刚满18,半年前从哥大主动辍学,放弃了超过2500万美元的股权投资,转身all in AI创业,创办了Build AI,而Egocentric-10K正是他最新的旗舰项目。
Build AI主打可扩展、具有经济价值的human- centric数据集构建,强调从“量”上突破。
而这,并不是他的第一次尝试创业。
大半年前,他设计了一副智能眼镜,可以将现场国际象棋比赛流式传输到Instagram,使用Stockfish引擎通过计算机分析比赛,并通过内置扬声器低声说出最佳棋步。

虽然这副眼镜因有作弊嫌疑而被批评质疑,但也确实让小哥火了一把。
而他最出圈的作品,当属AI流量预测工具CrowdTest。

简单来说,CrowdTest通过套壳大模型,模拟成千上万名用户对即将发布的推文可能产生的反应(A/B测试),从而对流量进行预测。
虽然没有免费试用,而且而且订阅价高达1000美元/月,但仍挡不住用户的热情,上线5小时后收入就突破了5万美金。
有趣的是,Eddy表示,如果使用后24 小时内没有效果增长,不仅可以退款,还能得到他本人直接售后支持。
这一手营销,也让CrowdTest在24小时内的总收入突破了3万美元。
除上述尝试以外,还有消息称,小哥在13岁就在地下车库开了第一家公司。
只能说,刚满18岁,就俨然一名创业老兵。
参考链接
[1]https://huggingface.co/datasets/builddotai/Egocentric-10K
[2]https://x.com/eddybuild/status/1987951621536641332
[3]https://www.linkedin.com/in/edwardxu1569/
[4]https://build.ai/
文章来自于“量子位”,作者“henry”。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda