深入理解EigenLayer的Inters
特斯拉大裁员后的豪赌,FSD v12 是如何诞生的
文章来源:晚点LatePost
上一次艰难时期的持续投入,成为特斯拉应对这一次艰难时期的武器。
文丨贺乾明
编辑丨黄俊杰
裁员 1 万多人、大幅缩减重要项目 4680 电池团队、负责三电系统的高级副总裁等高管离职……特斯拉 CEO 埃隆·马斯克在 4 月 15 日发起的大调整,只是一个序幕。
之后半个月,特斯拉持续裁撤曾经的重点项目:4680 电池项目继续裁员、北美的超级充电桩团队完全解散、9000 吨以上一体压铸机项目被叫停,相关高管大批离职。接下来的 6 月,特斯拉还会在加州和得州两地裁员超过 6000 人。
马斯克的新赌注是全自动驾驶。无人出租车(Robotaxi)项目被拔到最高优先级。马斯克宣布将在 8 月 8 日发布产品,今年投入百亿美元采购 GPU、研发车载芯片,用于改进自动驾驶系统。他曾多次说过,只要持续迭代这套系统,就会实现无人驾驶,让特斯拉成为 10 万亿美元市值公司。
在特斯拉的第二大市场中国,马斯克也期望用这套系统翻盘。4 月底,马斯克到访中国,被政府领导接见。不久后,他在内部信中说,特斯拉已在中国获得测试部分辅助驾驶系统的许可。
今年开始大面积推送的 FSD v12 自动驾驶系统确实展现出一些不同寻常的潜力。车主的反馈都很接近:“就像人开车一样”,跟上一代相比有进步,狭路会车、超车更从容。
自动驾驶公司元戎启行 CEO 周光今年 3 月在美国体验 FSD v12 后,承认还是低估了它的能力:“去之前我认为可能是 80 分的东西,但实际做到了 90 分。”
一家国内一线新能源企业负责人体验后相信,特斯拉的自动驾驶会有革命性突破。竞争对手们不敢错过,仅 4 月底北京车展前后,小鹏、华为、长城、商汤绝影等公司宣布将推出类似 FSD v12 的自动驾驶系统。同期,软银、英伟达和微软用 10.8 亿美元投资与特斯拉路线相同的英国自动驾驶公司 Wayve。
沿着特斯拉的路线,一场新的自动驾驶竞赛正在开启。这一次不只要解决技术难题,还是一场资源竞赛。来中国当天,马斯克在社交媒体上划出入局门槛:“任何公司,如果算力投入达不到百亿美元 ...... 就无法参与这一轮竞争。”
原理:砍掉 30 万行代码,让数据决定车怎么开
2000 年代,DARPA 在沙漠中举办的 3 场无人车挑战赛,是现代无人驾驶技术研发的源头。Google 招揽了优胜者,趟出一条可行的方案,将自动驾驶拆成多个环节:
用激光雷达、摄像头等传感器收集车辆周围环境数据,交给依赖人工标注数据训练出的模型,识别出常见的重要目标和各种障碍物(感知模块),再配合高精地图,让系统了解道路会怎么变化,最后依赖工程师用代码写成的规则决定车怎么开(预测、规划模块)
最初,特斯拉也按照 Google 开辟的路径去做自动驾驶,为了节省成本和迅速扩大使用范围,他们开发依赖摄像头,而不是昂贵的激光雷达和高精地图的方案。推出 v12 前,特斯拉的自动驾驶系统工作流程大概是:
特斯拉在 2021 年 AI Day 上公布的 FSD 系统架构(图片来自特斯拉)
为了尽可能应对路上遇到的各种情况,特斯拉数百名工程师写了 30 万行 C++ 代码制定规则——相当于早期 Linux 操作系统代码量的 1.7 倍。
这不是人学会开车的方式,人不需要认出一条路上可能出现的大量物体到底是什么,也不需要为每个复杂场景提前制定各种规则,就能开车上路。
这样做出来的自动驾驶系统,很难保证绝对安全。真实世界千变万化,再多的工程师也难以穷尽。现在商业化的无人出租车,只能在有限区域运营,车内没有安全员,只不过是运营方把他们转移到云端,远程盯着。
直到 2021 年,在路上遇到一排交通锥,Google 无人驾驶子公司 Waymo 的无人车还是有可能停下来拒绝行驶。此时 Google 已经带着整个行业投入上千亿美元。一批公司在那两年关停已经耗资数十亿美元的无人驾驶项目。
“付出 20% 的努力,就能获得 80% 的能力。” 小鹏原自动驾驶 AI 负责人刘兰个川去年在一场学术活动上说,传统自动驾驶方案开发简单,但继续提升困难。现在他加入英伟达智能汽车团队。
特斯拉 FSD v12 学开车更像人。最大的改变是用了 “端到端” 架构:一端输入摄像头等传感器获得的数据,另一端直接输出车该怎么开。
训练这套系统时,机器从大量车辆行驶视频和人类司机在不同环境下打方向盘、踩加速踏板的数据中学习怎么开车。
在 FSD v12 中,特斯拉工程师们写的规则几乎全被消灭,30 万行规则代码仅剩 2000 多行,不到原来的 1%。
端到端自动驾驶系统学开车的方式,也只是有一点像人,并没有系统能像人类一样真的理解世界。所以人学几天,就能开车上路安全驾驶,但 FSD 要看海量的视频学习。马斯克去年在一次财报会上谈到数据有多重要:“用 100 万个视频 case 训练,勉强够用;200 万个,稍好一些;300 万个,就会感到 Wow;到了 1000 万个,就变得难以置信了。”
“传统自动驾驶系统就像一个漏斗,信息一层层丢失。” 一位自动驾驶算法工程师说,传统方案的感知阶段,工程师们通常会设置 “白名单”,重点识别行人、车辆、车道线、红绿灯等重要目标,以节省算力。到了预测规划环节,工程师会提前设定,根据需求调用感知模块输出的信息完成工作,信息会再一次折损。因此传统方案很难像人一样用充分的信息决定怎么开车,要依赖工程师们提前写的规则。
而端到端方案中,摄像头等传感器获得的信息全部传递到决策环节,“信息无损传递,模型可以从感知数据中捕捉更多信息完成决策,提升系统应对各种复杂场景的能力。” 上述自动驾驶算法工程师说,因为是端到端架构,模型的决策也会直接影响感知环节,让它之后捕捉更多人意识不到但对驾驶有帮助的数据。
在许多场景,特斯拉 FSD v12 都有明显提升。一位自动驾驶从业者(知乎 @EatElephant)告诉我们,他体验后感觉到,与 v11 相比,v12 控制车辆的速度和转向 “很丝滑”,“即使坐在后排,路口转弯时几乎感觉不到任何顿挫”。为了保证安全,传统自动驾驶方案行车时,会时不时带下刹车。
他在一篇文章中写道,面对右前方有人骑自行车的场景,“v11 会过度小心,规划出一条非常离谱的大幅绕行路线,v12 从容淡定,绕行幅度接近人类司机的选择,速度控制和果断程度也非常合理。”
那些难以用规则描述的场景,FSD v12 的应对方式有明显进步。他举例,比如遇到路边开着双闪的亚马逊送货卡车,能迅速判断对向无车,立即借道绕行。而传统的方案大多数情况下都会停下来,或者等一段时间才会考虑采取行动。
FSD v12.3 更新推送后,一批车主在 YouTube 上传了车辆从容应对各种复杂的路况的视频,比如晚间穿越拥挤的纽约第五大道,30 分钟全程没怎么碰方向盘。
面对兴奋的车主们,美国公路交通安全管理局在 5 月 6 日发函要求特斯拉详细说明,如何防止车主滥用辅助驾驶系统,比如怎么提醒驾驶员 “把手放在方向盘上”。
基础:最难的几年依然坚持预装硬件、研发芯片、采集数据