特朗普力挺加密货币 或将
日本AI,失去的不止三十年
文章来源:远川科技评论
文|沈丹阳
编|陈彬
2019年,有两件事一直困扰着孙正义:软银的投资失败,以及日本科技的落后。
面对媒体,孙正义痛心地说道,科技产业几乎从日本消失了,我们正在成为一个被遗忘的国家。即将到来的AI革命,是日本重回牌桌最后的机会[1]。
随着ChatGPT问世,孙正义的呼吁终于成为了共识。然而,正当日本举国动员,准备一脚油门闯入赛道时,却发现了一个尴尬的事实:
日本目前的AI研究,非常依赖隔壁邻居为首的老外。
对此,RIKEN革新智慧综合研究中心负责人杉山将,曾做过一笔统计。
RIKEN(理化学研究所)是日本唯一的国家级科研机构,顶级头脑聚集地。汤川秀树等日本诺奖得主,都曾在这儿搞过研究。然而,那些被AI顶会收录的RIKEN论文,近一半的作者都隶属于外国大学,其中约一半的人来自中国[2]。
本土无人可用,使得日本在生成式AI浪潮里,始终处于失语状态。
然而,如若回溯历史,会发现日本也曾是个“AI超级大国”。
上世纪八九十年代,日本一度是深度学习的中心。杨立昆、余凯、林元庆、贾扬清等载入科技史册的泰斗级人物,都曾在日本的AI实验室度过一段青葱岁月。
曾经攥着一手王炸的日本,为何会迈向老无所依的结局?
站在日本人的肩膀上
上世纪80年代,正在读大学的杨立昆,被一群“疯子”吸引了。
彼时,深度学习是个“已被证伪”的技术路线。然而,仍有一小撮人在死磕,这其中就包括了一批日本科学家。杨立昆发现,当时大部分的深度学习论文,都是日本研究人员用英文写的。
这其中,对他影响最大的,是一位名叫福岛邦彦的日本人。
1980年,福岛邦彦参照猫的视觉结构,设计了一个叫做“神经认知机(Neocognitron)”的多层网络模型。
在生物的初级视觉皮层中,存在多个神经元,每个神经元只“掌管”一小部分视野。随后,神经元收集到的信息会统一传输到视觉皮层,组合成完整的视觉图像。
受此启发,福岛邦彦给神经认知机设计了“感知光照“和“运动信息”两个神经元,分别用来“提取图形信息”和“组成图形信息”。然而,福岛邦彦的神经认知机,存在一个致命问题:太超前了。
当时,主流的神经网络只有1层,但神经认知机有足足5层。
面对多层设计带来的种种问题,福岛邦彦一时找不到解决办法,导致神经认知机只能处理一些极其简单的工作。
直到1986年,辛顿提出了“反向传播算法”,这个问题才有了标准答案。
但若向前追溯反向传播算法,会发现其源头仍是日本人。上世纪60年代,日本数学家甘利俊一提出的“随机梯度下降方法”,为其提供了技术灵感[6]。只不过囿于特定时代的局限,甘利俊一没有条件在计算机上进行模拟验证。
1988年,杨立昆将神经认知机与反向传播结合在一起,打造出了大名鼎鼎的卷积神经网络。直到今天,卷积神经网络仍是图像识别领域最重要的算法之一。
由此可见,这些定义一个时代的AI研究成果,都是站在日本科学家肩膀上实现的。
实验室里的中国人
同一时期,日本的产业界,拉开了更为激进的历史篇章。
彼时,日本步入极度繁荣的泡沫经济时代。大型企业纷纷为爱发电,自掏腰包搭建中央实验室,发力基础科学。这其中,要数NEC(日本电器股份有限公司)最为激进:它直接切入美国科技产业腹地,将实验室开到了普林斯顿和硅谷。
财大气粗的NEC Lab,很快聚集了一大批日后响当当的名字。
西安交大软件学院院长、国家特聘教授龚怡宏,是第一个加入硅谷NEC Lab的国人科学家。在他担任实验室主任时期,延揽了一众青年才俊。