OpenAI至少已经是第二次与苹果旧将合作了。上次是Humane的AI Pin,以惨败收场;这次是io,已经有了原型,目标出货1亿台。
硅谷曾信奉“真正认真写软件的人,应该自己做硬件”。苹果一度是这一信仰的受益者。硬件公司io的灵魂人物是苹果前设计总监Jony Ive,操刀过iPhone与iPad等产品,创造了用户与移动互联网的全新交互方式。可以说,没有iPhone,就没有App。继任Ive原先在苹果的岗位的Evans Hankey,以及曾领导iPhone产品设计的Tang Tan也加入了io。
也许,想把AI真正做好,也需要先把硬件做出来。OpenAI+io,差不多可以算是地球上最强硬件团队与AI团队的组合了,看起来很有希望。再加上苹果如今迟迟拿不出自己的AI,连Apple Intelligence是什么都含糊其辞,用户们已经“粉转黑”,多么希望离开的Ive,替自己去实现对库克的“复仇”啊。于是,这笔交易迅速吸引了市场目光。
但目前OpenAI与io合作的第一款AI硬件的确凿信息少之又少。通过梳理媒体报道,我们知道的是:
奥特曼与Ive想要拿出超越iPhone的硬件来,不是新鲜事。2023年9月,媒体就曝光两人在旧金山就这款产品的外观举行头脑风暴。Ive的出发点是打造一款对屏幕依赖程度较低的交互式计算设备,他有减轻手机成瘾性的“道德责任”。2024年9月,Ive证实合作存在,着手通过生成式AI让新的计算设备成为可能。
今年4月,媒体曝光奥特曼有意支付5亿美元收购io,当时后者一直在研究不同的概念的AI硬件,包括智能家居;但初衷未变,就是在保证提供核心通信和生产力功能的同时,将用户从不间歇的屏幕与通知中解放出来。
简言之,Ive想要全新的、高效的、自然的人机交互方式,而奥特曼的OpenAI有机会替他实现这一点。而且,2023年到2025年,大模型的性能仍在提升,它所带来的交互体验,也从单向的对话式的ChatGPT,进化到了网状的更主动的Agent。
同样,奥特曼也追寻新的AI硬件已久。用户依然需要打开网页、敲字输入,这不是真正的AI时代。如果要在AI时代构建数十亿用户规模的消费者产品生态,新的硬件是意味着主动权在手的更大市场空间的平台。
此前,OpenAI投资了人形机器人领域1X、FigureAI和PI,原生AI硬件初创企业Humane,以及由摄像头业务转型的Opal,等等;还重新组建了机器人团队,挖来了Meta智能眼镜前负责人。今年2月,OpenAI向美国专利商标局(USPTO)提交一系列AI驱动的消费电子设备的商标申请。
但迄今为止,没有人真正成功。Ive的前同事们也不行。Humane的两位联合创始人也来自苹果,尽管名气没有Ive那么大,但也相当资深,一位是为苹果干了20年的设计,一位担任苹果的软件工程总监;团队半数以上都是苹果前员工。当时预期这家公司的产品AI Pin,可以大量调用GPT应用商店里的GPTs。但最终GPTs与AI Pin都没能做起来。
问题变成了怎么把硬件做出来。简单的照搬成功经验并不可行。Ive称像AI Pin的“产品中缺乏新的思维方式”。但他没有提点一下,到底需要怎么样的新思维。
在产品真正出来前,市场会有很多想象空间。比如已经有人想到了:
它要足够强大,足够小巧,足够省电。Ive帮OpenAI打造的“口袋里的智能体”,要突破规模量产的消费级AI硬件的不可能三角。
替代手机、记忆功能,这都要求它是移动的,这样才能覆盖用户完整的活动时间与空间。像苹果Vision Pro或Meta的Quest这样的设计恐怕不行,它们同样试图以空间计算创造新的交互方式,但显然更适合坐在沙发上玩。要覆盖长时段的使用,尤其是实时主动感知与准确推理,就还要保证续航。
尽管OpenAI声称第一款产品没有取代iPhone的计划,但1亿台的目标意味着它远远比第一款iPhone要更成功。苹果实现年销售1亿台iPhone的纪录,发生在2012年,当时已经更新到iPhone5。这意味着OpenAI的这款产品要在某种程度上实现iPhone基本能实现的任务,或拥有iPhone尚没有但用户一体验就离不开的功能。
传统的“可穿戴设备”正在重新接受AI的改造,包括手表、手环、首饰等等,身上能想到的部位几乎都试过了。目前行业最成功的尝试,就是智能眼镜。在今年的CES上,大量智能眼镜涌现,来自中国的雷鸟创新、Rokid等纷纷亮相。但全行业累计相加,也远远没有达到1亿台的程度。自2023年10月首次亮相以来,Meta已售出200万副Ray-Bans眼镜,并计划到2026年底每年生产1000万副Meta眼镜。
谷歌眼镜也在Gemini的“通用AI助手”帮助下重启了。昨天的I/O大会,当谷歌宣布Gentle Monster和Warby Parker成为自己智能眼镜合作伙伴的时候,你就能明白它明显是冲着Meta去的,后者的合作伙伴包括EssilorLuxottica和Ray-Ban。扎克伯格曾经多次声称,智能眼镜是人工智能的绝佳载体,是十年后替代智能手机的“圣杯”。
他说的还是交互。扎克伯格的核心逻辑之一,就是智能眼镜是个性化的,时刻在现场,但又不会割裂现实世界与数字世界。也就是,交互是自然而然发生的,不需要的时候,它会逐步隐退到背景以外。
不知道Ive是否认同这种交互原则?至少他认可,新的AI硬件“不会引人注目”。但他的新产品又不是智能眼镜,甚至他对于任何能戴在身上的物品都持怀疑态度。
到目前为止,那些交互方式上引人注目的AI硬件,往往高开低走。AI Pin与Rabbit R1是口碑翻车最严重的两款。本质上,它们只是换了壳的类ChatGPT工具,以语音或光线生成来自大模型的回答;它们至多只能取代iPhone上某些应用频次不高的工具。使用它们,需要频繁抬手当作屏幕,或者将硬件当成对讲机。这些往往是令人感到多余的交互动作。
还有部分AI硬件,只进入垂直领域。完成一种任务,只需要相对固定的传统的交互方式。不够新,但也不刻意。Plaud与NotePin主打长续航多语种转录摘要,是生产力工具,取代录音笔的市场地位。但它们面临来自传统的智能手机与应用市场的挤压。
(从上到下,从左到右:萌友智能的Ropet,GROOVE X的LOVOT,Casio的Moflin,TCL的AI ME;机智连接的Plaud与NotePin,字节跳动的Ola Friend;可触未来的Looi;仙瞬科技的Halliday,魅族的StarV Air,雷鸟的V3,灵伴科技的Rokid)
还有不少小型团队,放弃了去卷那些不必要的功能边界,只是在核心功能上,附加弱交互的AI情绪价值。比如主打AI陪伴的Ropet与Looi,前者是毛茸茸的萌宠,没有AI都能卖得不错,大模型让它有了宠物该有的灵气,定位于语言沟通中无法捕捉的弱陪伴场景;后者的主业是移动设备的支撑与充电,手机连上去后,屏幕上会出现表情,根据环境与互动变化,它还能成为一个自动追踪的摄像头支架。
不同的AI硬件承载着对AI应用的不同的期待,但有一点是肯定的,它必须看起来和用起来都像一个“智能体”。Ive当年与乔布斯一起设计iPhone于2007年推出,开创了智能手机时代,让全世界几十亿人整天盯着手机屏幕看,Ive能设计出自然伴随人类的“智能体”硬件,颠覆iPhone吗?
文章来自于“未尽研究”,作者“未尽研究”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/