本篇为《为什么日本出不来DeepSeek》的下篇。在此笔者将介绍两家在日本虽在头部,却又十分另类的AI公司,以及日本AI产业背后的推动者们。
想要勾勒出日本AI行业的面貌着实不太容易。AI公司又少又慢又没声音,技术看上去也是半吊子。跟很多曾经驰骋国际今天却逐渐去国际化的日企一样,它们的生意,从研发到销售服务,从上游到下游,从头到尾似乎不需要日本以外企业的参与。
笔者斗胆,称它们的存在为“孤岛闭环链”。
一
如何判断一家公司的产品或服务是否属于“前沿AI创新”而非传统的IT信息化?
人们通常是从这四个维度来判断:
从这四个层面依次审视,日本AI创业一哥Preferred Networks都是真AI,而非IT信息化。
它曾经信誓旦旦要国际化,却终究走回了在日本岛内发展的“孤岛闭环链”,令人唏嘘。在它之后,对出海有所计划的日本高科技企业恐怕也会抖三抖,掂量掂量在海外形成商业闭环到底行不行。毕竟,老大哥Preferred Networks被打回老巢了。
Preferred Networks成立于2014年,横空出世便开发了深度学习框架Chainer,让日本业界寄予厚望。
它的产品通用性很强。工业自动化、医疗和材料科学、自主移动机器人、教育产品各领域的产品方案都有。
可以说是各个产业开花。它目前拥有全球范围内435项专利,其中287项仍有效,涵盖213个独立的专利族,算是日本为数不多的强技术公司。
大语言模型呢?也有。它研发了日本第一个大语言模型PLaMo(国産大規模言語モデル),专注于日语和日本文化,并且逐渐针对法律、金融、医疗等行业进行了优化,而且还为金融业客户提供了专门的“LLM活用支援服务”,养了一个专门服务客户的金融专业团队。
但是从PLaMo的推出,Preferred Networks的本土化倾向就初见端倪:对日语的特殊结构和语法理解再深也没用,在国际化方面,这件事只能是减分项。
不仅是语言。PFN的创始团队主要为日本工程师。中国工程师在GitHub和开源社区畅谈人工智能、区块链、机器学习,日本工程师在GitHub几乎就很少露面。
而且日本有一种相对保守的文化,对公开分享代码和技术相对谨慎,无论是自己的代码,还是涉及到客户的信息。几个月前,日本有人把前东家信息带到了新东家因此被逮捕,笔者所在公司都因此加强了警惕,颁布了很多办公室保密要求。
融资方面,Preferred Networks不跟VC玩,只拿CVC(来自大企业的风险投资)。它成立10年完成了不到5轮融资,虽然融资金额高达百亿日元级,但是没有传统意义上的A/B/C轮的融资节奏。主要投资方是日本国内的大企业(丰田、日产、NTT、JXTG 能源、三井物产等)。对很多科技公司来说这并不稀奇,甚至可以说,越是有技术能力的企业,越是未来可能要仰仗大客户的企业,越容易早早被本土大厂盯上。
只拿CVC,不To C,不追求爆款,不卖API服务收费,融资节奏慢,不做英语大语言模型,国际化弱——Preferred Networks精准地踩中了“不发展成DeepSeek”的每一个点。
二
Preferred Networks的深度学习框架Chainer曾经对标于谷歌的TensorFlow和Facebook的PyTorch。2014‐2018年,它频繁在一些顶级国际会议上投稿和刷脸。
但是在PyTorch逐渐成为深度学习领域的事实标准之后,2020年,咱们的主角Preferred Networks宣传Chainer开发终止,转向与PyTorch合作。这意味着,它曾经想依靠Chainer自立山头,现在它放弃了自己的“山头”,成了别人的小弟。
Preferred Networks的英文内容减少,2023年之后在国际会议上的发表频率逐年降低。它逐渐转为为丰田、日产、三菱等大客户定制AI系统,为日本大厂定制聪明的脑瓜,而它所服务的很多大厂本身也在逐渐构建日本本土产业链,内向型发展。
但笔者不认为它会继续封闭下去。
其一,2024年它又创办了一个子公司Preferred Elements,老公司Preferred Networks偏向于产业应用和商业化,推动落地,新公司Preferred Elements更像是基础技术平台。一个赚钱养家,一个再创山头。
其二,它的前研究员,行业知名的自由研究者齋藤真樹透露,他在Preferred Networks参与的许多研究内容并未公开,是因为成果优先用于产业应用,并通过专利保护,而非公开发表。说明技术底蕴并不薄。
其三,创始团队的心态好像在变得更加开放。Preferred Networks主创团队有一个坚持了13年的读书会,今年的隆重推荐外国著作,还包括咱们的《三体》。
但是,Preferred Networks继续被大企业绑架的可能性有吗?也不是不可能。
2025年1月,Preferred Networks又和三菱商事成立了合资公司,它占股51%,共同研发的是它自主研发的省电AI处理器MN-Core系列的AI云计算服务。绕了半天,抛来橄榄枝的还是本土大厂,Preferred Networks也勇敢地双向奔赴。
三
日本的头部AI公司拉个单子出来,Preferred Networks确实遥遥领先。
日本AI头部企业的技术能力,打✅的为强项,○为中等,❌为较弱
有人把“自主学习/生成能力”称为真AI的分水岭。那么我们挑一家唯独不善于“自主学习/生成能力”的公司来聊聊。
PKSHA Technology,“东京大学松尾研究室”系,2012年创办,2017年9月在东京证券交易所的Mothers市场IPO,2024年迁移到Prime市场。
Mothers是“Market of the High-growth and Emerging Stocks”的缩写,意思是“成长型和新兴股票市场”,类似于中国的创业板;Prime类似于我们的主板,是东京证券交易所的最高级别市场,对企业的市值、流动性、治理结构等方面有更高的要求。
PKSHA Technology的盈利能力了得。
PKSHA Technology财报数据(单位:亿日元)
谁在为它买单?客户涵盖零售、汽车、保险、教育等多个行业,例如三菱UFJ银行引入了PKSHA Chatbot,ANA集团引入了PKSHA Speech Insight。
不过,PKSHA还保留着国际化发展的野望,它与微软,腾讯等公司在人工智能方面合作,与NVIDIA在GPU加速的深度学习合作,还通过孵化器Techstars投资了一些AI初创公司。
确实,它不擅长自主学习/生成能力,它的主要产品是“应用型AI”,不是“生成型AI”,它依赖传统机器学习方法,而非大规模自监督学习,也很少看到它在顶级期刊发表跟生成模型、大型自主学习模型相关的突破性论文。它更像一家AI工程公司,而不是科研驱动型公司。
但是盈利能力强。
这就带出一个现象:Preferred Networks是2014年创办,PKSHA是2012年,美国的OpenAI是2015年底,中国的AI四小龙是2016年之后。为什么日本AI公司起得这么早(同时赶了个晚集)?
早期AI公司,比如PKSHA在最初几年做的其实是自然语言处理,算不得什么真正的AI。不过,日本早年间确实储备了一批不错的工程师,而且东京大学、京都大学、东京工业大学等学术界对机器学习很早就有关注。日本产业界(比如丰田、日产)早早就有了“自动化”需求,侧面推动着AI相关的小项目。
另一边,中国的情况是,2015年后AI资本热潮启动,政府政策倾斜,VC疯狂推高估值,再加上移动互联网红利(比如手机人脸识别),很快有了大量实际应用场景。
所以在上一篇文章后,有读者私信我,希望从文化的角度分析一下。确实啊,归根结底日本人没有开发一个通用大平台的雄心,中国发生的很多事,是他们想都不敢想的。
四
最后,介绍一下日本AI行业的其他角色。
角色一:“国家队”组织
众所周知,国家队类似于创投行业的第三方公司,提供的无非是:钱,人,商业机会,信息交流,政策支持。
“人”非常重要,日本作为一个“人人考证”的迷之国度,在AI方面也推出了若干认证考试,甚至有如下:
这些不一定能促进AI从业者的增加。但有一件事也许能行:
METI牵头了与总部加拿大公司Tenstorrent的合作,在接下来5年之中从日本选拔最多200名硅芯片工程师,派遣至其位于美国的研发基地,参与偏核心研发工作,培训计划结束后回到日本的各自公司。
日美之间的合作,似乎是日本国家队最容易安排的合作。
角色二:大学/国立研究机构
杉山将和松尾丰是日本AI产业界的“双核心”,两位都是东京大学教授,前者是理论派,后者推动日本AI产业落地;前者是日本在国际AI学术圈中发表数量最多、被引量最高的研究者之一;后者是产业连接器+政策顾问+创业导师。
角色三:大公司
大公司的AI团队究竟发展如何? NEC、NTT、富士通、日立等都有AI部门,主要服务于政府、基础设施、B2B业务,很少对C端曝光。
如果我们用前文的四个标准来看,那么情况如下:
我们来总结一下。
讲来讲去,日本出不来DeepSeek似乎更加合理了。即使是Preferred Networks也无法研发出足以自立山头的产品。这届通用型AI机会,日本是一个都薅不上了。
我想起自己当年做记者时,同行写过一篇封面《狗x的Tencent》。在日本没有BAT、TMD,但是有传统大厂。有人想着防火防盗防大公司,有人却觉得抱大腿越早越好,谁一定是错的呢?
有点老钱,有点科技的底子,在没有经历较大的革新之前,恐怕大概率会继续下去。尤其是在国民生活足够方面的基础上,越舒服越死板。
那种颠覆式创新的力量会出现吗?会从哪里出现?
但是反过来思考,一次次颠覆创新的我们,才是不正常的那个。创新,也许原本就不是世界的常态,而是奇迹。
本文来自微信公众号:日商日旅,作者:KYOKU
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)